Cookie の設定を選択する

当社は、当社のサイトおよびサービスを提供するために必要な必須 Cookie および類似のツールを使用しています。当社は、パフォーマンス Cookie を使用して匿名の統計情報を収集することで、お客様が当社のサイトをどのように利用しているかを把握し、改善に役立てています。必須 Cookie は無効化できませんが、[カスタマイズ] または [拒否] をクリックしてパフォーマンス Cookie を拒否することはできます。

お客様が同意した場合、AWS および承認された第三者は、Cookie を使用して便利なサイト機能を提供したり、お客様の選択を記憶したり、関連する広告を含む関連コンテンツを表示したりします。すべての必須ではない Cookie を受け入れるか拒否するには、[受け入れる] または [拒否] をクリックしてください。より詳細な選択を行うには、[カスタマイズ] をクリックしてください。

VPC エンドポイントを使用した Amazon S3 データストアのクロール

フォーカスモード
VPC エンドポイントを使用した Amazon S3 データストアのクロール - AWS Glue

セキュリティ、監査、または制御の目的で、Amazon S3 データストアまたは Amazon S3 でバックアップされたデータカタログテーブルにはAmazon Virtual Private Cloud 環境 (Amazon ) を介してのみアクセスするようにすることができますVPC。このトピックでは、接続Networkタイプを使用してVPCエンドポイント内の Amazon S3 データストアまたは Amazon S3 でバックアップされたデータカタログテーブルへの接続を作成してテストする方法について説明します。

データストアでクローラーを実行するには、次のタスクを実行します。

前提条件

Amazon Virtual Private Cloud 環境 (Amazon ) を介してアクセスする Amazon S3 データストアまたは Amazon S3 でバックアップされたデータカタログテーブルをセットアップするためのこれらの前提条件を満たしていることを確認しますVPC。

  • 設定済みの VPC。例: vpc-01685961063b0d84b。詳細については、「Amazon ユーザーガイド」の「Amazon の使用開始VPC」を参照してください。 VPC

  • にアタッチされた Amazon S3 エンドポイントVPC。例: vpc-01685961063b0d84b。詳細については、Amazon S3のエンドポイント」を参照してください。 VPC

    にアタッチされた Amazon S3 エンドポイントの例VPC。
  • VPC エンドポイントを指すルートエントリ。例えば、VPCエンドポイントで使用されるルートテーブルの vpce-0ec5da4d265227786 (vpce-0ec5da4d265227786) です。

    VPC エンドポイントを指すルートエントリの例。
  • にACLアタッチされたネットワークは、トラフィックVPCを許可します。

  • にアタッチされたセキュリティグループは、トラフィックVPCを許可します。

Amazon S3 への接続を作成する

通常、Amazon Virtual Private Cloud (Amazon VPC) 内にリソースを作成して、パブリックインターネット経由でアクセスできないようにします。デフォルトでは、 AWS Glue は 内のリソースにアクセスできませんVPC。 AWS Glue が 内のリソースにアクセスできるようにするにはVPC、VPCサブネットIDsとセキュリティグループ を含む追加の VPC固有の設定情報を提供する必要がありますIDs。Network 接続を作成するには、次の情報を指定することが必要です。

  • VPC ID

  • 内のサブネット VPC

  • セキュリティグループ

Network 接続をセットアップするには

  1. AWS Glue コンソールのナビゲーションペインで、[Add connection] (接続の追加) をクリックします。

  2. 接続名を入力し、接続タイプとして、[Network] (ネットワーク) を選択します。[Next (次へ)] を選択します。

    接続タイプの選択。
  3. VPC、サブネット、セキュリティグループ情報を設定します。

    • VPC: データストアを含むVPC名前を選択します。

    • サブネット: 内のサブネットを選択しますVPC。

    • セキュリティグループ: 内のデータストアへのアクセスを許可する 1 つ以上のセキュリティグループを選択しますVPC。

    接続タイプの選択。
  4. [Next (次へ)] を選択します。

  5. 接続情報を確認し、[Finish] (完了) をクリックします。

    接続タイプの選択。

Amazon S3 への接続をテストする

Network 接続を作成したら、VPCエンドポイント内の Amazon S3 データストアへの接続をテストできます。

接続のテスト時に、次のエラーが発生することがあります。

  • INTERNET CONNECTION ERROR: インターネット接続の問題を示します。

  • INVALID BUCKET ERROR: Amazon S3 バケットに問題があることを示します。

  • S3 CONNECTION ERROR: Amazon S3 への接続に失敗したことを示します。

  • INVALID CONNECTION TYPE: 接続タイプに期待値がないことを示します。 NETWORK

  • INVALID CONNECTION TEST TYPE: ネットワーク接続テストのタイプに問題があることを示します。

  • INVALID TARGET: Amazon S3 バケットが正しく指定されていないことを示します。

Network 接続をテストするには

  1. AWS Glue コンソールで [Network] (ネットワーク) 接続を選択します。

  2. [Test connection] を選択します。

  3. 前のステップで作成したIAMロールを選択し、Amazon S3 バケットを指定します。

  4. テストを開始するには、[Test connection] (接続のテスト) をクリックします。結果を表示するには少し時間がかかることがあります。

接続のテスト

エラーが発生した場合は、次のチェックを行います。

  • 選択したロールに正しい権限が与えられている。

  • 正しい Amazon S3 バケットが指定されている。

  • セキュリティグループとネットワークは、必要な送受信トラフィックACLを許可します。

  • VPC 指定した は Amazon S3 VPCエンドポイントに接続されています。

接続のテストに成功したら、クローラーを作成できます。

Amazon S3 データストアのクローラーを作成する

これで、作成した Network 接続を指定したクローラーを作成できます。クローラーの作成についての詳細については、「クローラーの設定」を参照してください。

  1. まず、 AWS Glue コンソールのナビゲーションペインでクローラーを選択します。

  2. [Add crawler (クローラーの追加) ] を選択します。

  3. クローラーの名前を指定して、[Next] (次へ) をクリックします。

  4. データソースを要求されたら、[S3] (S3) を選択し、Amazon S3 バケットプレフィックスと前に作成した接続を指定します。

    接続のテスト
  5. 必要に応じて、同じネットワーク接続に別のデータストアを追加します。

  6. IAM ロールを選択します。IAM ロールは、 AWS Glue サービスと Amazon S3 バケットへのアクセスを許可する必要があります。詳細については、「クローラーの設定」を参照してください。

    接続のテスト
  7. クローラーのスケジュールを定義します。

  8. データカタログの既存のデータベースを選択するか、新しいデータベースエントリを作成します。

    接続のテスト
  9. 残りのセットアップを完了します。

Amazon S3 backed データカタログテーブルのクローラーを作成する

これで、作成した Network 接続とカタログソースタイプを指定するクローラーを作成できます。クローラーの作成についての詳細については、「クローラーの設定」を参照してください。

  1. まず、 AWS Glue コンソールのナビゲーションペインでクローラーを選択します。

  2. [Add crawler (クローラーの追加) ] を選択します。

  3. クローラーの名前を指定して、[Next] (次へ) をクリックします。

  4. クローラーソースタイプを要求されたら、[既存のカタログテーブル] を選択し、使用可能なテーブルのリストからクロールする既存のカタログテーブルを指定します。

    クローラーソースタイプの選択。
  5. IAM ロールを選択します。IAM ロールは、 AWS Glue サービスと Amazon S3 バケットへのアクセスを許可する必要があります。詳細については、「クローラーの設定」を参照してください。

  6. クローラーのスケジュールを定義します。

  7. データカタログの既存のデータベースを選択するか、新しいデータベースエントリを作成します。

  8. 残りのセットアップを完了し、ステップを確認します。

    クローラーソースタイプの選択。

クローラーの実行

クローラーを実行します。

オンデマンドでのクローラーの実行。

トラブルシューティング

VPC ゲートウェイを使用した Amazon S3 バケットに関連するトラブルシューティングについては、「ゲートウェイVPCエンドポイントを使用して S3 バケットに接続できないのはなぜですか?」を参照してください。

プライバシーサイト規約Cookie の設定
© 2025, Amazon Web Services, Inc. or its affiliates.All rights reserved.