AWS Glue の Amazon Q データ統合は、Amazon Q パネルに質問を入力できるようにします。AWS Glue が提供するデータ統合機能に関する質問を入力できます。詳細な回答は、参照ドキュメントとともに返されます。
もう 1 つのユースケースは、AWS Glue ETL ジョブスクリプトの生成です。データの抽出、変換、読み込みジョブの実行方法について質問できます。生成された PySpark スクリプトが返されます。
Amazon Q チャットインタラクション
AWS Glue コンソールで、新しいジョブの作成を開始し、Amazon Q に以下を依頼します。:「私のデータベース glue_db で 2 つの Glue カタログテーブルの会場とイベントに接続する Glue ETL フローを作成し、会場の venueid とイベントの e_venueid の結果を結合します。次に、venuestate=='DC' という条件で会場のステータスをフィルターして、CSV 形式で s3://amzn-s3-demo-bucket/codegen/BDB-9999/output/ に書き込みます」
コードが生成されていることがわかります。このレスポンスを使用すると、目的に合わせて AWS Glue コードを作成する方法を理解できます。生成されたコードをスクリプトエディタにコピー/貼り付けて、プレースホルダーを設定できます。IAM ロールと AWS Glue 接続をジョブで設定したら、そのジョブを保存して実行します。ジョブが完了すると、サマリーデータが想定したとおりに Amazon S3 に保持され、ダウンストリームのワークロードで使用できることを確認できます。
AWS Glue Studio ノートブックのインタラクション
注記
AWS Glue Studio ノートブックの Amazon Q Data 統合エクスペリエンスは、引き続き DynamicFrame ベースのデータ統合フローに焦点を当てています。
新しいセルを追加してコメントを入力して、達成したい内容を説明します。[Tab] と [Enter] を押すと、推奨コードが表示されます。
最初の目的はデータを抽出することです。「Glue Data Catalog テーブルを読み取るコードを提供してください」、「star_rating>3 でフィルター変換を適用するコードを提供してください」、「フレームを Parquet として S3 に書き込むコードを提供してください」。
Amazon Q チャットエクスペリエンスと同様に、コードが推奨されます。[Tab] を押すと、推奨コードが選択されます。
生成されたコードのソースに適したオプションを入力して、各セルを実行できます。show()
メソッドを使用して、実行の任意の時点でデータセットのサンプルをプレビューすることもできます。
プログラムで選択するか [実行] を選択することで、ノートブックをジョブとして実行できます。
複雑なプロンプト
1 つの複雑なプロンプトで完全なスクリプトを生成できます。S3 には JSON データがあり、Oracle には組み合わせが必要なデータがあります。両方のソースから読み取り、結合を行い、結果を Redshift に書き込む Glue スクリプトを指定してください。」
ノートブックでは、AWS Glue の Amazon Q データ統合によって、Amazon Q チャットで生成されたのと同じコードスニペットが生成されていることに気付くかもしれません。
[実行] またはプログラムで選択することで、ノートブックをジョブとして実行できます。