Step Functions で AWS Glue DataBrew ジョブを開始する - AWS Step Functions

Step Functions で AWS Glue DataBrew ジョブを開始する

DataBrew 統合を使用して、Step Functions で分析および機械学習のワークフローにデータのクリーニングとデータの正規化手順を追加する方法について説明します。

Step Functions で AWS サービスと統合することについては、「 サービスとの統合」および「Step Functions でサービス API にパラメータを渡す」を参照してください。

以下には、リクエスト/レスポンス DataBrew ジョブがスタートする Task 状態が含まれます。

"DataBrew StartJobRun": { "Type": "Task", "Resource": "arn:aws:states:::databrew:startJobRun", "Parameters": { "Name": "sample-proj-job-1" }, "Next": "NEXT_STATE" },

以下には、DataBrew ジョブをスタートする Task 状態が含まれます。

"DataBrew StartJobRun": { "Type": "Task", "Resource": "arn:aws:states:::databrew:startJobRun.sync", "Parameters": { "Name": "sample-proj-job-1" }, "Next": "NEXT_STATE" },
Step Functions のパラメータは PascalCase で表されます。

ネイティブサービス API が、API アクション startSyncExecution などの camelCase である場合でも、StateMachineArn などの PascalCase でパラメータを指定します。

サポートされている DataBrew API

DataBrew を呼び出すための IAM ポリシー

以下のテンプレート例では、ステートマシンの定義におけるリソースに基づき、AWS Step Functions による IAM ポリシーの生成方法を示しています。詳細については、Step Functions が統合サービスの IAM ポリシーを生成する方法およびStep Functions でサービス統合パターンを検出するを参照してください。

Run a Job (.sync)
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "databrew:startJobRun", "databrew:listJobRuns", "databrew:stopJobRun" ], "Resource": [ "arn:aws:databrew:{{region}}:{{accountId}}:job/*" ] } ] }
Request Response
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "databrew:startJobRun" ], "Resource": [ "arn:aws:databrew:{{region}}:{{accountId}}:job/*" ] } ] }