Amazon Redshift ソースノードの作成 - AWS Glue

Amazon Redshift ソースノードの作成

必要となる許可

Amazon Redshift データソースを使用する AWS Glue Studio ジョブには追加の許可が必要です。ETL ジョブに許可を追加する方法の詳細については、「ETL ジョブに必要な IAM アクセス許可を確認する」を参照してください。

Amazon Redshift 接続を使用するには、次の許可が必要です。

  • redshift-data:ListSchemas

  • redshift-data:ListTables

  • redshift-data:DescribeTable

  • redshift-data:ExecuteStatement

  • redshift-data:DescribeStatement

  • redshift-data:GetStatementResult

Amazon Redshift データソースの追加

データソース — Amazon Redshift ノードを追加するには
  1. Amazon Redshift アクセスタイプを選択します。

    • 直接データ接続 (推奨) — Amazon Redshift データに直接アクセスする場合は、このオプションを選択してください。これは推奨されるオプションで、デフォルトでもあります。

    • Data Catalog tables — 使用したいデータカタログテーブルがある場合は、このオプションを選択してください。

  2. [直接データ接続] を選択した場合は、Amazon Redshift データソースへの接続を選択します。既に接続が存在していて、それらの接続から選択できることが前提です。接続の作成が必要な場合は、[Redshift 接続の作成] を選択します。詳細については、「コネクタと接続の使用に関する概要」を参照してください。

    接続を選択したあとは、[プロパティを表示] をクリックすると、接続のプロパティを表示できます。URL、セキュリティグループ、サブネット、アベイラビリティーゾーン、説明、作成時刻 (UTC) と最終更新時刻 (UTC) のタイムスタンプなど、接続についての情報が表示されます。

  3. Amazon Redshift のソースオプションを選択してください。

    • [Choose a single table] - これは、単一の Amazon Redshift テーブルからアクセスするデータを含むテーブルです。

    • カスタムクエリを入力 — カスタムクエリに基づき、Amazon Redshift の複数のテーブルからデータセットにアクセスできます。

  4. 単一のテーブルを選択した場合は、Amazon Redshift のスキーマを選択します。選択したテーブルによって、使えるスキーマのリストが決まります。

    または、[カスタムクエリを入力] を選択します。このオプションを選択すると、Amazon Redshift の複数のテーブルから、カスタムデータセットにアクセスできます。このオプションを選択した場合は、Amazon Redshift クエリを入力します。

    Amazon Redshift サーバーレス環境に接続するときに、カスタムクエリに次の許可を追加します。

    GRANT SELECT ON ALL TABLES IN <schema> TO PUBLIC

    [スキーマを推測] を選択すると、入力したクエリに基づいてスキーマを読み取ることができます。[Redshift クエリエディタを開く] を選択して、Amazon Redshift クエリを入力することもできます。詳細については、「クエリエディタを使用してデータベースのクエリを実行する」を参照してください。

  5. [パフォーマンスとセキュリティ] で、Amazon S3 のステージングディレクトリと IAM ロールを選択します。

    • Amazon S3 ステージングディレクトリ — データを一時的にステージングする、Amazon S3 の場所を選択します。

    • IAM ロール — 選択した Amazon S3 に書き込める IAM ロールを選択します。

  6. [カスタム Redshift パラメータ - オプション] に、パラメータと値を入力します。