多次元データレイアウトのソート (プレビュー) - Amazon Redshift

多次元データレイアウトのソート (プレビュー)

以下は、多次元データレイアウトソートに関するプレリリースドキュメントで、プレビューリリース版です。ドキュメントと機能はどちらも変更されることがあります。この特徴は、本番環境ではなくテストクラスターでのみ使用することをお勧めします。プレビューの契約条件については、AWS のサービス条件の「ベータサービスへの参加」を参照してください。
注記

この機能はプレビュークラスターとプレビューワークグループでのみ使用できます。プレビュークラスターを作成するには、「Amazon Redshift 管理ガイド」の「プレビュークラスターの作成」を参照してください。プレビューワークグループを作成するには、「Amazon Redshift 管理ガイド」の「プレビューワークグループの作成」を参照してください。

多次元データレイアウトソートキーは、ワークロード内の反復述語に基づく AUTO ソートキータイプの一つです。ワークロードに反復述語がある場合、Amazon Redshift は反復述語を満たすデータ行をコロケーションすることでテーブルスキャンのパフォーマンスを向上させることができます。多次元データレイアウトソートキーでは、テーブルのデータを厳密な列順序で保存する代わりに、ワークロードに現れる反復述語を分析してデータを格納します。1 つのワークロードに複数の反復述語が見られる場合があります。ワークロードによっては、このようなソートキーを使用すると多くの述語のパフォーマンスが向上します。Amazon Redshift は、このソートキーメソッドを AUTO ソートキーで定義されたテーブルに使用すべきかどうかを自動的に判断します。

例えば、データを列の順序でソートしたテーブルがあるとします。多くのデータブロックを調べて、それらがワークロードの述語を満たしているかどうかを判断する必要があるかもしれません。ただし、データが述語順にディスクに保存されている場合は、クエリを満たすためにスキャンする必要があるブロックの数が少なくなります。このような場合は、多次元データレイアウトソートキーを使用すると便利です。

クエリが多次元データレイアウトキーを使用しているかどうかを確認するには、SYS_QUERY_DETAIL ビューの step_attribute 列を参照してください。値が multi-dimensional の場合、クエリには多次元データレイアウトが使用されています。AUTO ソートキーで定義されたテーブルが多次元データレイアウトを使用しているかどうかを確認するには、SVV_TABLE_INFO ビューの sortkey1 列を参照してください。値が padb_internal_mddl_key_col である場合は、テーブルのソートキーに多次元データレイアウトが使用されています。

Amazon Redshift が多次元データレイアウトソートキーを使用しないようにするには、SORTKEY AUTO 以外の別のテーブルソートキーオプションを選択します。SORTKEY オプションの詳細については、「CREATE TABLE」を参照してください。