Amazon Redshift ソースノードの作成
必要となる許可
Amazon Redshift データソースを使用する AWS Glue Studio ジョブには追加の許可が必要です。ETL ジョブに許可を追加する方法の詳細については、「ETL ジョブに必要な IAM アクセス許可を確認する」を参照してください。
Amazon Redshift 接続を使用するには、次の許可が必要です。
-
redshift-data:ListSchemas
-
redshift-data:ListTables
-
redshift-data:DescribeTable
-
redshift-data:ExecuteStatement
-
redshift-data:DescribeStatement
-
redshift-data:GetStatementResult
Amazon Redshift データソースの追加
データソース — Amazon Redshift ノードを追加するには
-
Amazon Redshift アクセスタイプを選択します。
-
直接データ接続 (推奨) — Amazon Redshift データに直接アクセスする場合は、このオプションを選択してください。これは推奨されるオプションで、デフォルトでもあります。
-
Data Catalog tables — 使用したいデータカタログテーブルがある場合は、このオプションを選択してください。
-
-
[直接データ接続] を選択した場合は、Amazon Redshift データソースへの接続を選択します。既に接続が存在していて、それらの接続から選択できることが前提です。接続の作成が必要な場合は、[Redshift 接続の作成] を選択します。詳細については、「コネクタと接続の使用に関する概要」を参照してください。
接続を選択したあとは、[プロパティを表示] をクリックすると、接続のプロパティを表示できます。URL、セキュリティグループ、サブネット、アベイラビリティーゾーン、説明、作成時刻 (UTC) と最終更新時刻 (UTC) のタイムスタンプなど、接続についての情報が表示されます。
-
Amazon Redshift のソースオプションを選択してください。
-
[Choose a single table] - これは、単一の Amazon Redshift テーブルからアクセスするデータを含むテーブルです。
-
カスタムクエリを入力 — カスタムクエリに基づき、Amazon Redshift の複数のテーブルからデータセットにアクセスできます。
-
-
単一のテーブルを選択した場合は、Amazon Redshift のスキーマを選択します。選択したテーブルによって、使えるスキーマのリストが決まります。
または、[カスタムクエリを入力] を選択します。このオプションを選択すると、Amazon Redshift の複数のテーブルから、カスタムデータセットにアクセスできます。このオプションを選択した場合は、Amazon Redshift クエリを入力します。
Amazon Redshift サーバーレス環境に接続するときに、カスタムクエリに次の許可を追加します。
GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC
[スキーマを推測] を選択すると、入力したクエリに基づいてスキーマを読み取ることができます。[Redshift クエリエディタを開く] を選択して、Amazon Redshift クエリを入力することもできます。詳細については、「クエリエディタを使用してデータベースのクエリを実行する」を参照してください。
-
[パフォーマンスとセキュリティ] で、Amazon S3 のステージングディレクトリと IAM ロールを選択します。
-
Amazon S3 ステージングディレクトリ — データを一時的にステージングする、Amazon S3 の場所を選択します。
-
IAM ロール — 選択した Amazon S3 に書き込める IAM ロールを選択します。
-
-
[カスタム Redshift パラメータ - オプション] に、パラメータと値を入力します。