Amazon Athena の設定 Amazon Redshift の設定 CUR 2.0 の処理するための推奨 SQL クエリ

データエクスポートの処理

次のセクションでは、データエクスポートの管理について説明します。

Amazon Athena の設定

コストと使用状況レポート (CUR) とは異なり、データエクスポートではエクスポートをクエリするように Athena を設定するための SQL ファイルは提供されていません。データエクスポートには CloudFormation テンプレートを使用するか (オプション 1 を参照)、Athena を手動で設定する必要があります (オプション 2 を参照)。

(オプション 1) CloudFormation テンプレートを使用する: CloudFormation テンプレートとデータエクスポートで Athena を設定する手順を見つけるには、「Cloud Intelligence Dashboards Framework のデータエクスポート」を参照してください。

（オプション 2) AWS Glue クローラを使用して Athena のテーブルとパーティションを構築する： Athena の CUR を作成するときは、Apache Parquet ファイル形式を使用することをお勧めします。これにより、圧縮と列指向のストレージが改善され、Athena クエリが小さくて安価になります。上書き配信設定は、各月次パーティションに常に各ファイルのコピーが 1 つだけ含まれ、Amazon Athena でクエリを実行するときに重複する行項目が表示されないようにするために必要です。

また、 AWS Glue クローラで Glue を使用して、データを Athena にロードすることをお勧めします。

Glue クローラを使用して Athena AWS のテーブルとパーティションを構築するには

次のデータエクスポート配信オプションを使用して CUR 2.0 のエクスポートを作成します。
- 圧縮タイプとファイル形式: Parquet - Parquet
- ファイルバージョニング: 既存のデータエクスポートファイルを上書きする
Athena で、Trino SQL でノートブックエディタを使用し、作成を選択してAWS 「Glue クローラ」でテーブルを作成します。Glue クローラーワークフローを使用して、Glue クローラーを s3://<bucket-name>/<prefix>/<export-name>/data フォルダで実行するように指定し、指定されたエクスポートのすべての配信済みパーティションを Athena に自動的にロードします。
Glue クローラーが完了したら、Athena を使用して、Glue クローラーによって作成されたテーブルにクエリを記述できます。

Amazon Redshift の設定

Amazon Redshift は、プロビジョンドキャパシティまたはサーバーレスモデルのいずれかでアクセスできるクラウドデータウェアハウスです。Amazon Redshift は、データエクスポートからのデータを処理するための高速なクエリパフォーマンスを提供します。

現在、データエクスポートでは、コストと使用状況レポート (CUR) のようにエクスポートをクエリするように Redshift を設定するための SQL ファイルは提供されていません。ただし、エクスポートをクエリするように Athena を手動で設定することはできます。Redshift には gzip/csv 圧縮とファイル形式を使用することをお勧めします。

Redshift のセットアップの詳細については、「Amazon Redshift 入門ガイド」を参照してください。

CUR 2.0 の処理するための推奨 SQL クエリ

CUR 2.0 エクスポートデータを Amazon Athena や Amazon Redshift などのデータ分析ツールにロードした後、コストと使用状況に関するインサイトを得るためにデータを処理できます。 AWS Well-Architected Labs は、CUR の処理に使用できる CUR クエリライブラリを提供します。詳細については、「AWS CUR クエリライブラリ」を参照してください。

SQL クエリに関する次の 2 つの情報に注意してください。

Well-Architected Labs の SQL クエリは、データエクスポートのクエリフィールドでは動作しません。データエクスポートは、集計や、これらのクエリで使用されるその他の SQL 構文の一部をサポートしていないためです。
Well-Architected Labs の SQL クエリは、列の名前をデフォルト名から変更していない場合にのみ動作します。クエリによっては、ドット演算子を使用して製品列の一部を別の列としてクエリする必要がある場合があります。詳細については、「データクエリ − SQL クエリとテーブル設定」を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

コストと使用状況ダッシュボード

コストと使用状況ダッシュボードについて