Amazon VPC フローログのクエリ - Amazon Athena

Amazon VPC フローログのクエリ

Amazon Virtual Private Cloud フローログは、VPC 内のネットワークインターフェイス間で送受信される IP トラフィックに関する情報をキャプチャします。このログを使用してネットワークトラフィックのパターンを調査し、VPC ネットワーク全体の脅威やリスクを特定します。

Amazon VPC フローログのクエリを実行するには、2 つの方法があります。

  • Amazon VPC コンソール — Amazon VPC コンソールの Athena 統合機能を使用して、パーティションを含む Athena データベース、ワークグループ、およびフローログテーブルを作成する AWS CloudFormation テンプレートを生成します。テンプレートでは、事前定義されたフローログのクエリのセットも作成します。これは、VPC を通過するトラフィックに関するインサイトの取得に使用できます。

    このアプローチの詳細については、「Amazon VPC ユーザーガイド」の「Amazon Athena を使用したフローログのクエリ」を参照してください。

  • Amazon Athena コンソール — Athena コンソールでテーブルやクエリを直接作成します。詳細については、引き続きこのページを参照してください。

Athena でログのクエリを開始する前に、VPC フローログを有効化し、それらが Amazon S3 バケットに保存されるように設定します。ログを作成したら、それを数分間実行していくらかのデータを収集します。ログは、Athena で直接クエリできる GZIP 圧縮形式で作成されます。

VPC フローログの作成時に、フローログで返すフィールドおよびフィールドが表示される順序を指定する際は、カスタム形式を使用できます。フローログレコード詳細については、「Amazon VPC ユーザーガイド」の「フローログレコード」を参照してください。

考慮事項と制約事項

Athena で Amazon VPC フローログのテーブルを作成する際は、次の点に注意してください。

  • デフォルトでは、Parquet は名前で列にアクセスします。詳細については、「スキーマの更新を処理する」を参照してください。

  • Athena の列名には、フローログレコードの名前を使用します。Athena スキーマの列名は、Amazon VPC フローログのフィールド名と完全に一致する必要があります。ただし、これらには次の違いがあります。

    • Amazon VPC のログフィールド名のハイフンは、Athena の列名ではアンダースコアに置き換えられます。Athena のデータベース名、テーブル名、および列名で使用できる文字については、「データベース、テーブル、列に名前を付ける」を参照してください。

    • バックティックで囲むことで、Athena で予約されたキーワードであるフローログのレコード名をエスケープします。

  • VPC フローログは AWS アカウント 固有です。ログファイルを Amazon S3 に発行すると、Amazon VPC が Amazon S3 で作成するパスには、フローログの作成に使用された AWS アカウント の ID が含まれます。詳細については、「Amazon VPC ユーザーガイド」の「フローログを Amazon S3 に発行する」を参照してください。