集合类型
集合类型提供了一种组织和构造数据的方法,以便进行高效的检索和分析。它们用于机器学习数据库以定义数据集及其元素的架构。在 Amazon SageMaker Feature Store 中,支持的集合类型包括列表、集和向量。
集合是一组元素,集合中的每个元素都必须具有相同的特征类型(String
、Integral
或 Fractional
)。例如,一个集合可以包含所有特征类型均为 Fractional
的元素,但不能包含某些特征类型为 Fractional
而某些特征类型为 String
的元素。
目前只有 InMemory
在线存储特征组支持产品系列类型。以下列表介绍了集合类型选项。
列表:元素的有序集合。
-
列表长度由集合中的元素数量决定。
-
示例:您可以有一个诸如 [‘a’, ‘b’, ‘a’] 之类的列表,因为该列表保留了顺序,可以有重复的元素。
集:由各个唯一元素组成的无序集合。
-
集的长度由集合中唯一元素的数量决定。
-
示例:您不能拥有诸如 [‘a’, 'b', 'a'] 之类的集,因为它包含重复元素。该集将包含元素 [‘a’, ‘b’],因为该集仅包含唯一元素。
向量:表示固定大小的元素数组的专用列表。元素的顺序具有重要意义,因此元素的位置代表数据的某些属性。
-
向量集合类型的元素必须 具有
Fractional
特征类型。 -
每个在线存储
InMemory
层特征组只能有一种向量集合类型。 -
向量的维度(向量中元素的数量)由您预先确定并使用
VectorDimension
指定。最大维度限制为 8192。 -
示例:您可以有一个诸如 [4.2, -6.3, 4.2] 之类的向量,其中第一个、第二个和第三个元素可以表示物理空间中的 x、y 和 z 位置。
集合的长度没有限制,只要不超过记录的最大大小即可。有关记录的最大大小,请参阅配额、命名规则和数据类型。