選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

建立爬蟲程式排程

焦點模式
建立爬蟲程式排程 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

您可以使用 AWS Glue 主控台或 為爬蟲程式建立排程 AWS CLI。

AWS Management Console
  1. 登入 AWS Management Console,並在 https://https://console.aws.amazon.com/glue/ 開啟 AWS Glue主控台。

  2. 在導覽窗格中選擇 Crawlers (爬蟲程式)

  3. 請遵循 設定爬蟲程式區段中的步驟 1-3。

  4. 在 中步驟 4:設定輸出和排程,選擇爬蟲程式排程以設定執行的頻率。您可以選擇爬蟲程式以每小時、每天、每週、每月執行,或使用 Cron 表達式定義自訂排程。

    cron 表達式是代表排程模式的字串,由 6 個以空格分隔的欄位組成:* * * * * <minute> <hour> <day of month> <month> <day of week> <year>

    例如,若要每天在午夜執行任務,cron 表達式為:0 0 * * ? *

    如需詳細資訊,請參閱 Cron 表達式。

  5. 檢閱您設定的爬蟲程式設定,並建立爬蟲程式以排程執行。

AWS CLI
aws glue create-crawler --name myCrawler \ --role AWSGlueServiceRole-myCrawler \ --targets '{"S3Targets":[{Path="s3://amzn-s3-demo-bucket/"}]}' \ --schedule cron(15 12 * * ? *)
  1. 登入 AWS Management Console,並在 https://https://console.aws.amazon.com/glue/ 開啟 AWS Glue主控台。

  2. 在導覽窗格中選擇 Crawlers (爬蟲程式)

  3. 請遵循 設定爬蟲程式區段中的步驟 1-3。

  4. 在 中步驟 4:設定輸出和排程,選擇爬蟲程式排程以設定執行的頻率。您可以選擇爬蟲程式以每小時、每天、每週、每月執行,或使用 Cron 表達式定義自訂排程。

    cron 表達式是代表排程模式的字串,由 6 個以空格分隔的欄位組成:* * * * * <minute> <hour> <day of month> <month> <day of week> <year>

    例如,若要每天在午夜執行任務,cron 表達式為:0 0 * * ? *

    如需詳細資訊,請參閱 Cron 表達式。

  5. 檢閱您設定的爬蟲程式設定,並建立爬蟲程式以排程執行。

如需有關使用 Cron 排程工作和爬蟲程式的詳細資訊,請參閱 任務和爬蟲程式以時間為基礎的排程

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。