AWS Glue Studio でのデータ準備レシピの使用
[データ準備レシピ] 変換を使用すると、インタラクティブなグリッドスタイルオーサリングインターフェイスを使用して、データ準備レシピを最初から作成できます。また、既存の AWS Glue DataBrew レシピをインポートし、AWS Glue Studio で編集することもできます。
データ準備レシピノードは、リソースパネルから使用できます。データ準備レシピノードは、データソースノードであるか別の変換ノードであるかに関らず、ビジュアルワークフロー内の別のノードに接続できます。AWS Glue DataBrew レシピとバージョンを選択すると、レシピに適用されたステップがノードのプロパティタブに表示されます。
前提条件
-
AWS Glue DataBrew レシピをインポートする場合、「AWS Glue Studio で AWS Glue DataBrew レシピをインポートする」で説明されているように、必要な IAM アクセス許可があります。
-
データプレビューセッションを作成する必要があります。
制約事項
-
AWS Glue DataBrew レシピは、商用 DataBrew リージョンでのみサポートされています。
-
すべての AWS Glue DataBrew レシピが AWS Glue でサポートされているわけではありません。一部のレシピは AWS Glue Studio では実行できません。
-
UNION
およびJOIN
変換を使用するレシピはサポートされていませんが、AWS Glue Studio には、データ準備レシピノードの前後で使用できる「Union」および「Join」変換ノードが既に存在します。
-
-
データ準備レシピノードは AWS Glue バージョン 4.0 以降のジョブでサポートされています。このバージョンは、データ準備レシピノードがジョブに追加されると自動選択されます。
-
データ準備レシピノードには Python が必要です。Python は、データ準備レシピノードがジョブに追加されると自動設定されます。
-
ビジュアルグラフに新しいデータ準備レシピノードを追加すると、データ準備レシピノードを使用する正しいライブラリでデータプレビューセッションが自動的に再開されます。
-
データ準備レシピノードでのインポートまたは編集では、
GROUP_BY
、PIVOT
、UNPIVOT
、およびTRANSPOSE
の変換はサポートされていません。
その他の機能
[データ準備レシピ] 変換を選択すると、[レシピの作成] を選択した後に追加のアクションを実行できます。
-
ステップの追加 – ステップの追加アイコンを選択するか、[プレビュー] ペインのツールバーを使用してアクションを選択して、必要に応じてレシピにステップを追加できます。
-
レシピのインポート — [その他] を選択し、AWS Glue Studio ジョブで使用するレシピをインポートします。
-
YAML としてダウンロード – [その他]、次に [YAML としてダウンロード] を選択してレシピをダウンロードし、AWS Glue Studio の外部に保存します。
-
JSON としてダウンロード – [その他]、次に [JSON としてダウンロード] を選択してレシピをダウンロードし、AWS Glue Studio の外部に保存します。
-
レシピステップの元に戻すとやり直す – グリッドでデータを操作するときに、[プレビュー] ペインでレシピステップを元に戻したりやり直したりすることができます。