As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Tipos de coleção
Os tipos de coleção fornecem uma maneira de organizar e estruturar dados para recuperação e análise eficientes. Eles são usados em bancos de dados de ML para definir o esquema de um conjunto de dados e seus elementos. Na Amazon SageMaker Feature Store, os tipos de coleção compatíveis incluem lista, conjunto e vetor.
Coleções são um agrupamento de elementos em que cada elemento dentro da coleção deve ter o mesmo tipo de atributo (String
, Integral
ou Fractional
). Por exemplo, uma coleção pode conter elementos com todos os tipos de atributos do elemento como Fractional
, mas uma coleção não pode conter elementos com alguns tipos de atributos Fractional
e alguns tipos de atributos como String
.
Atualmente, somente os grupos de atributos do armazenamento on-line InMemory
oferecem suporte a tipos de coleção. A lista a seguir descreve as opções do tipo de coleção.
Lista: uma coleção ordenada de elementos.
-
O tamanho da lista é determinado pela quantidade de elementos na coleção.
-
Exemplo: você pode ter uma lista como [‘a’, ‘b’, ‘a’], porque a lista preserva a ordem e pode ter elementos repetidos.
Conjunto: uma coleção não ordenada de elementos exclusivos.
-
O tamanho do conjunto é determinado pela quantidade de elementos exclusivos na coleção.
-
Exemplo: você não pode ter um conjunto como [‘a’, ‘b’, ‘a’], porque ele contém um elemento repetido. Em vez disso, o conjunto terá os elementos [‘a’, ‘b’], porque o conjunto contém apenas elementos exclusivos.
Vetor: uma lista especializada que representa uma matriz de elementos de tamanho fixo. A ordem dos elementos tem importância, de forma que as posições dos elementos representem certas propriedades dos dados.
-
Os elementos no tipo de coleção de vetores devem ter o tipo de atributo
Fractional
. -
Você só pode ter um tipo de coleção de vetores por grupo de atributos do nível
InMemory
do armazenamento on-line. -
A dimensão (número de elementos no vetor) do vetor é predeterminada por você e é especificada usando
VectorDimension
. O limite máximo de dimensão é 8192. -
Exemplo: você pode ter um vetor como [4.2, -6.3, 4.2], em que o primeiro, o segundo e o terceiro elementos podem representar as posições x, y e z no espaço físico.
Não há limites para o comprimento das coleções, desde que elas não excedam o tamanho máximo de um registro. Para saber o tamanho máximo de um registro, consulte Cotas, regras de nomenclatura e tipos de dados.