Cookie の設定を選択する

当社は、当社のサイトおよびサービスを提供するために必要な必須 Cookie および類似のツールを使用しています。当社は、パフォーマンス Cookie を使用して匿名の統計情報を収集することで、お客様が当社のサイトをどのように利用しているかを把握し、改善に役立てています。必須 Cookie は無効化できませんが、[カスタマイズ] または [拒否] をクリックしてパフォーマンス Cookie を拒否することはできます。

お客様が同意した場合、AWS および承認された第三者は、Cookie を使用して便利なサイト機能を提供したり、お客様の選択を記憶したり、関連する広告を含む関連コンテンツを表示したりします。すべての必須ではない Cookie を受け入れるか拒否するには、[受け入れる] または [拒否] をクリックしてください。より詳細な選択を行うには、[カスタマイズ] をクリックしてください。

クローラーで複数のデータソースを使用する

フォーカスモード
クローラーで複数のデータソースを使用する - Amazon Athena

AWS Glue クローラが Amazon S3 をスキャンして複数のディレクトリを検出すると、ヒューリスティックを使用してテーブルのルートがディレクトリ構造内のどこにあり、どのディレクトリがテーブルのパーティションであるかを判断します。複数のディレクトリで同様のスキーマが検出されると、クローラは、これらを個別のテーブルではなくパーティションとみなす場合があります。クローラで個別のテーブルを検出しやすくするには、1 つの方法として各テーブルのルートディレクトリをクローラのデータストアとして追加します。

以下の Amazon S3 のパーティションは、その一例です。

s3://amzn-s3-demo-bucket/folder1/table1/partition1/file.txt s3://amzn-s3-demo-bucket/folder1/table1/partition2/file.txt s3://amzn-s3-demo-bucket/folder1/table1/partition3/file.txt s3://amzn-s3-demo-bucket/folder1/table2/partition4/file.txt s3://amzn-s3-demo-bucket/folder1/table2/partition5/file.txt

table1table2 のスキーマが類似し、AWS Glue のデータソースが s3://amzn-s3-demo-bucket/folder1/ に対して 1 つのみ設定されている場合、クローラは 1 つのテーブルを 2 つのパーティション列で作成することがあります。1 つのパーティション列に table1table2 が入り、別のパーティション列に partition1partition5 が入ります。

AWS Glue クローラで 2 つのテーブルを別個に作成するには、クローラに 2 つのデータソース (s3://amzn-s3-demo-bucket/folder1/table1/s3://amzn-s3-demo-bucket/folder1/table2) を設定します。以下に手順を示します。

AWS Glue で既存のクローラーに S3 データストアを追加するには
  1. AWS Management Consoleにサインインし、AWS Glue コンソール (https://console.aws.amazon.com/glue/) を開きます。

  2. ナビゲーションペインで、[Crawlers (クローラ) ] を選択します。

  3. クローラーへのリンクを選択してから、[編集] を選択します。

  4. [ステップ 2: データソースと分類子を選択する] で、[編集] を選択します。

  5. [データソースとカタログ] で、[データソースを追加] を選択します。

  6. [Add data source] (データソースの追加) ダイアログボックスの [S3 path] (S3 パス) で、[Browse] (ブラウズ) を選択します。

  7. 使用したいバケットを選択し、[Choose] (選択) を選択します。

    追加したデータソースは、[Data sources ] (データソース) リストに表示されます。

  8. [Next] を選択します。

  9. [Configure security settings] (セキュリティ設定の構成) ページで、クローラーの IAM ロールを選択してから、[Next] (次へ) を選択します。

  10. S3 パスの末尾がスラッシュで終わっていることを確認し、[Add an S3 data source] (S3 データソースの追加) を選択します。

  11. [Set output and scheduling] (出力とスケジュールの設定) ページの、[Output configuration] (出力の設定) で、ターゲットデータベースを選択します。

  12. [Next] を選択します。

  13. [Review and update] (確認と更新) ページで、選択した内容を確認します。ステップを編集するには、[Edit] (編集) を選択します。

  14. [Update] (更新) を選択します。

プライバシーサイト規約Cookie の設定
© 2025, Amazon Web Services, Inc. or its affiliates.All rights reserved.