启动 AWS Glue DataBrew 使用 Step Functions 的工作 - AWS Step Functions

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

启动 AWS Glue DataBrew 使用 Step Functions 的工作

了解如何使用 Step F DataBrew unctions 将数据清理和数据标准化步骤添加到分析和机器学习工作流程中。

要了解如何与集成 AWS Step Functions 中的服务,参见集成 服务和。在 Step Functions API 中向服务传递参数

以下内容包括启动请求-响应 DataBrew任务的Task状态。

"DataBrew StartJobRun": { "Type": "Task", "Resource": "arn:aws:states:::databrew:startJobRun", "Parameters": { "Name": "sample-proj-job-1" }, "Next": "NEXT_STATE" },

以下内容包括启动同步 DataBrew 作业的Task状态。

"DataBrew StartJobRun": { "Type": "Task", "Resource": "arn:aws:states:::databrew:startJobRun.sync", "Parameters": { "Name": "sample-proj-job-1" }, "Next": "NEXT_STATE" },
中的参数 Step Functions 表示为 PascalCase

即使原生服务API已在camelCase(例如API操作)中startSyncExecution,您也可以在中指定参数 PascalCase,例如:StateMachineArn

支持的 DataBrew APIs

IAM通话政策 DataBrew

以下示例模板演示了如何操作 AWS Step Functions 根据状态机定义中的资源生成IAM策略。有关更多信息,请参阅Step Functions 如何为集成服务生成IAM策略在 Step Functions 中探索服务集成模式

Run a Job (.sync)
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "databrew:startJobRun", "databrew:listJobRuns", "databrew:stopJobRun" ], "Resource": [ "arn:aws:databrew:{{region}}:{{accountId}}:job/*" ] } ] }
Request Response
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "databrew:startJobRun" ], "Resource": [ "arn:aws:databrew:{{region}}:{{accountId}}:job/*" ] } ] }