기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
컬렉션 유형
컬렉션 유형은 효율적인 검색 및 분석을 위해 데이터를 구성하고 구조화하는 방법을 제공합니다. ML 데이터베이스에서 데이터 세트 및 해당 요소의 스키마를 정의하는 데 사용됩니다. Amazon SageMaker Feature Store에서 지원되는 컬렉션 유형에는 목록, 세트 및 벡터가 포함됩니다.
컬렉션은 컬렉션 내 각 요소가 동일한 특성 유형(String
, Integral
, 또는 Fractional
)을 가져야 하는 요소 그룹입니다. 예를 들어 컬렉션에는 모든 요소 특성 유형이 Fractional
인 요소가 포함될 수 있지만, 컬렉션에는 일부 특성 유형이 Fractional
이고 일부 특성 유형은 String
인 요소는 포함될 수 없습니다.
현재 InMemory
온라인 저장소 특성 그룹만 컬렉션 유형을 지원합니다. 다음 목록에서는 컬렉션 유형 옵션에 대해 설명합니다.
목록: 순서가 지정된 요소 컬렉션입니다.
-
목록의 길이는 컬렉션에 있는 요소 수에 따라 결정됩니다.
-
예: 목록은 순서를 유지하고 반복되는 요소를 포함할 수 있으므로 ['a', 'b', 'a']와 같은 목록을 만들 수 있습니다.
세트: 순서가 지정되지 않은 고유 요소 모음.
-
세트의 길이는 컬렉션에 있는 고유 요소 수에 따라 결정됩니다.
-
예: ['a', 'b', 'a']와 같은 세트는 반복 요소를 포함하므로 사용할 수 없습니다. 세트에는 고유한 요소만 포함되므로 집합에는 대신 ['a', 'b'] 요소가 포함됩니다.
벡터: 고정 크기의 요소 배열을 나타내는 특수 목록입니다. 요소의 순서가 중요성을 지니며 요소의 위치가 데이터의 특정 속성을 나타냅니다.
-
벡터 컬렉션 유형의 요소에는
Fractional
특성 유형이 반드시 있어야 합니다. -
온라인 저장소
InMemory
계층 특성 그룹당 벡터 컬렉션 유형을 하나만 사용할 수 있습니다. -
벡터의 디멘션(벡터의 요소 수)은 사용자가 미리 결정하며
VectorDimension
을 사용하여 지정합니다. 최대 디멘션 한도는 8192입니다. -
예: [4.2, -6.3, 4.2]와 같은 벡터를 사용할 수 있습니다.여기서 첫 번째, 두 번째, 세 번째 요소는 물리적 공간에서의 x, y, z 위치를 나타낼 수 있습니다.
레코드의 최대 크기를 초과하지 않는 한 컬렉션 길이에는 제한이 없습니다. 레코드의 최대 크기는 할당량, 이름 지정 규칙 및 데이터 형식섹션을 참조하세요.