컬렉션 유형 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

컬렉션 유형

컬렉션 유형은 효율적인 검색 및 분석을 위해 데이터를 구성하고 구조화하는 방법을 제공합니다. ML 데이터베이스에서 데이터 세트 및 해당 요소의 스키마를 정의하는 데 사용됩니다. Amazon SageMaker Feature Store에서 지원되는 컬렉션 유형에는 목록, 세트 및 벡터가 포함됩니다.

컬렉션은 컬렉션 내 각 요소가 동일한 특성 유형(String, Integral, 또는 Fractional)을 가져야 하는 요소 그룹입니다. 예를 들어 컬렉션에는 모든 요소 특성 유형이 Fractional인 요소가 포함될 수 있지만, 컬렉션에는 일부 특성 유형이 Fractional이고 일부 특성 유형은 String인 요소는 포함될 수 없습니다.

현재 InMemory온라인 저장소 특성 그룹만 컬렉션 유형을 지원합니다. 다음 목록에서는 컬렉션 유형 옵션에 대해 설명합니다.

목록: 순서가 지정된 요소 컬렉션입니다.

  • 목록의 길이는 컬렉션에 있는 요소 수에 따라 결정됩니다.

  • 예: 목록은 순서를 유지하고 반복되는 요소를 포함할 수 있으므로 ['a', 'b', 'a']와 같은 목록을 만들 수 있습니다.

세트: 순서가 지정되지 않은 고유 요소 모음.

  • 세트의 길이는 컬렉션에 있는 고유 요소 수에 따라 결정됩니다.

  • 예: ['a', 'b', 'a']와 같은 세트는 반복 요소를 포함하므로 사용할 수 없습니다. 세트에는 고유한 요소만 포함되므로 집합에는 대신 ['a', 'b'] 요소가 포함됩니다.

벡터: 고정 크기의 요소 배열을 나타내는 특수 목록입니다. 요소의 순서가 중요성을 지니며 요소의 위치가 데이터의 특정 속성을 나타냅니다.

  • 벡터 컬렉션 유형의 요소에는 Fractional특성 유형이 반드시 있어야 합니다.

  • 온라인 저장소 InMemory계층 특성 그룹당 벡터 컬렉션 유형을 하나만 사용할 수 있습니다.

  • 벡터의 디멘션(벡터의 요소 수)은 사용자가 미리 결정하며 VectorDimension을 사용하여 지정합니다. 최대 디멘션 한도는 8192입니다.

  • 예: [4.2, -6.3, 4.2]와 같은 벡터를 사용할 수 있습니다.여기서 첫 번째, 두 번째, 세 번째 요소는 물리적 공간에서의 x, y, z 위치를 나타낼 수 있습니다.

레코드의 최대 크기를 초과하지 않는 한 컬렉션 길이에는 제한이 없습니다. 레코드의 최대 크기는 할당량, 이름 지정 규칙 및 데이터 형식섹션을 참조하세요.