翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データエクスポートの処理
次のセクションでは、データエクスポートの管理について説明します。
Amazon Athena の設定
コストと使用状況レポート (CUR) とは異なり、データエクスポートではエクスポートをクエリするように Athena を設定するための SQL ファイルは提供されていません。データエクスポートには CloudFormation テンプレートを使用するか (オプション 1 を参照)、Athena を手動で設定する必要があります (オプション 2 を参照)。
(オプション 1) CloudFormation テンプレートを使用する: CloudFormation テンプレートとデータエクスポートで Athena を設定する手順を見つけるには、「Cloud Intelligence Dashboards Framework のデータエクスポート
(オプション 2) AWS Glue クローラを使用して Athena のテーブルとパーティションを構築する: Athena の CUR を作成するときは、Apache Parquet ファイル形式を使用することをお勧めします。これにより、圧縮と列指向のストレージが改善され、Athena クエリが小さくて安価になります。上書き配信設定は、各月次パーティションに常に各ファイルのコピーが 1 つだけ含まれ、Amazon Athena でクエリを実行するときに重複する行項目が表示されないようにするために必要です。
また、 AWS Glue クローラで Glue を使用して、データを Athena にロードすることをお勧めします。
Glue クローラを使用して Athena AWS のテーブルとパーティションを構築するには
-
次のデータエクスポート配信オプションを使用して CUR 2.0 のエクスポートを作成します。
-
圧縮タイプとファイル形式: Parquet - Parquet
-
ファイルバージョニング: 既存のデータエクスポートファイルを上書きする
-
-
Athena で、Trino SQL でノートブックエディタを使用し、作成を選択してAWS 「Glue クローラ」でテーブルを作成します。Glue クローラーワークフローを使用して、Glue クローラーを s3://<bucket-name>/<prefix>/<export-name>/data フォルダで実行するように指定し、指定されたエクスポートのすべての配信済みパーティションを Athena に自動的にロードします。
-
Glue クローラーが完了したら、Athena を使用して、Glue クローラーによって作成されたテーブルにクエリを記述できます。
Amazon Redshift の設定
Amazon Redshift は、プロビジョンドキャパシティまたはサーバーレスモデルのいずれかでアクセスできるクラウドデータウェアハウスです。Amazon Redshift は、データエクスポートからのデータを処理するための高速なクエリパフォーマンスを提供します。
現在、データエクスポートでは、コストと使用状況レポート (CUR) のようにエクスポートをクエリするように Redshift を設定するための SQL ファイルは提供されていません。ただし、エクスポートをクエリするように Athena を手動で設定することはできます。Redshift には gzip/csv 圧縮とファイル形式を使用することをお勧めします。
Redshift のセットアップの詳細については、「Amazon Redshift 入門ガイド」を参照してください。
CUR 2.0 の処理するための推奨 SQL クエリ
CUR 2.0 エクスポートデータを Amazon Athena や Amazon Redshift などのデータ分析ツールにロードした後、コストと使用状況に関するインサイトを得るためにデータを処理できます。 AWS Well-Architected Labs は、CUR の処理に使用できる CUR クエリライブラリを提供します。詳細については、「AWS CUR クエリライブラリ
SQL クエリに関する次の 2 つの情報に注意してください。
-
Well-Architected Labs の SQL クエリは、データエクスポートのクエリフィールドでは動作しません。データエクスポートは、集計や、これらのクエリで使用されるその他の SQL 構文の一部をサポートしていないためです。
-
Well-Architected Labs の SQL クエリは、列の名前をデフォルト名から変更していない場合にのみ動作します。クエリによっては、ドット演算子を使用して製品列の一部を別の列としてクエリする必要がある場合があります。詳細については、「データクエリ − SQL クエリとテーブル設定」を参照してください。