多维数据布局排序(预览版) - Amazon Redshift

多维数据布局排序(预览版)

以下是预览版中的表多维数据布局排序的预发行文档。文档和特征都可能会更改。我们建议您只在测试集群中使用此功能,而不要在生产环境中使用。有关预览条款和条件,请参阅 AWS 服务条款中的测试版服务参与
注意

此功能仅在使用预览集群或预览工作组时可用。要创建预览版集群,请参阅《Amazon Redshift 管理指南》中的创建预览版集群。要创建预览工作组,请参阅《Amazon Redshift 管理指南》中的创建预览工作组

多维数据布局排序键是一种基于工作负载中重复谓词的 AUTO 排序键。如果您的工作负载具有重复谓词,那么 Amazon Redshift 可以通过将满足重复谓词的数据行放在同一位置来提高表扫描性能。多维数据布局排序键不是按照严格的列顺序存储表数据,而是通过分析工作负载中出现的重复谓词来存储数据。在一个工作负载中可以找到多个重复谓词。根据您的工作负载,这种排序键可以提高许多谓词的性能。Amazon Redshift 会自动确定是否应将这种排序键方法用于使用 AUTO 排序键定义的表。

例如,假设您有一个按列顺序排列数据的表。可能需要检查许多数据块,以确定它们是否满足工作负载中的谓词。但是,如果数据是按谓词顺序存储在磁盘上的,那么为满足查询需要扫描的数据块就会减少。在这种情况下,使用多维数据布局排序键是有益的。

要查看查询是否使用了多维数据布局键,请查看 SYS_QUERY_DETAIL 视图的 step_attribute 列。当值为 multi-dimensional 时,多维数据布局用于查询。要查看使用 AUTO 排序键定义的表是否使用了多维数据布局,请查看 SVV_TABLE_INFO 视图的 sortkey1 列。当值为 padb_internal_mddl_key_col 时,多维数据布局用于表排序键。

要防止 Amazon Redshift 使用多维数据布局排序键,请选择除 SORTKEY AUTO 之外的其他表排序键选项。有关 SORTKEY 选项的更多信息,请参阅 CREATE TABLE