添加触发器 - AWS Glue

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

添加触发器

您可以使用 AWS Glue 控制台、 AWS Command Line Interface (AWS CLI) 或 AWS Glue API 添加触发器。

注意

目前, AWS Glue 控制台在使用触发器时仅支持作业,而不支持爬网程序。您可以使用 AWS CLI 或 AWS Glue API 来配置同时支持作业和爬网程序的触发器。

添加触发器(控制台)
  1. 登录 AWS Management Console,然后打开 AWS Glue 控制台,网址为:https://console.aws.amazon.com/glue/

  2. 在导航窗格中,于 ETL 下,选择 Triggers (触发器)。选择 Add trigger (添加触发器)

  3. 提供以下属性:

    名称

    赋予您的触发器一个唯一的名称。

    触发器类型

    指定下列项之一:

    • Schedule (计划):触发器按特定的频率和时间触发。

    • Job events (作业事件):条件触发器。当列表中的任何或所有作业进入其指定状态时,触发器就会触发。要让触发器触发,受监控的作业必须由触发器启动。对于您选择的任何作业,您只能监控一个作业事件(完成状态)。

    • On-demand (按需):触发器会在激活时触发。

  4. 完成触发器向导。在 Review (审查) 页面上,您可以选择 Enable trigger on creation (在创建时启用触发器),立即激活 Schedule (计划)Job events (任务事件)(条件)触发。

添加触发器 (AWS CLI)
  • 输入类似以下的命令。

    aws glue create-trigger --name MyTrigger --type SCHEDULED --schedule "cron(0 12 * * ? *)" --actions CrawlerName=MyCrawler --start-on-creation

    此命令会创建一个名为 MyTrigger 的计划触发器 ,该触发器每天在 UTC 时间中午 12:00 运行,并启动一个名为 MyCrawler 的爬网程序。该触发器在创建时处于激活状态。

有关更多信息,请参阅 AWS Glue 触发器