Tipos de coleção - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Tipos de coleção

Os tipos de coleção fornecem uma maneira de organizar e estruturar dados para recuperação e análise eficientes. Eles são usados em bancos de dados de ML para definir o esquema de um conjunto de dados e seus elementos. Na Amazon SageMaker Feature Store, os tipos de coleção compatíveis incluem lista, conjunto e vetor.

Coleções são um agrupamento de elementos em que cada elemento dentro da coleção deve ter o mesmo tipo de atributo (String, Integral ou Fractional). Por exemplo, uma coleção pode conter elementos com todos os tipos de atributos do elemento como Fractional, mas uma coleção não pode conter elementos com alguns tipos de atributos Fractional e alguns tipos de atributos como String.

Atualmente, somente os grupos de atributos do armazenamento on-line InMemory oferecem suporte a tipos de coleção. A lista a seguir descreve as opções do tipo de coleção.

Lista: uma coleção ordenada de elementos.

  • O tamanho da lista é determinado pela quantidade de elementos na coleção.

  • Exemplo: você pode ter uma lista como [‘a’, ‘b’, ‘a’], porque a lista preserva a ordem e pode ter elementos repetidos.

Conjunto: uma coleção não ordenada de elementos exclusivos.

  • O tamanho do conjunto é determinado pela quantidade de elementos exclusivos na coleção.

  • Exemplo: você não pode ter um conjunto como [‘a’, ‘b’, ‘a’], porque ele contém um elemento repetido. Em vez disso, o conjunto terá os elementos [‘a’, ‘b’], porque o conjunto contém apenas elementos exclusivos.

Vetor: uma lista especializada que representa uma matriz de elementos de tamanho fixo. A ordem dos elementos tem importância, de forma que as posições dos elementos representem certas propriedades dos dados.

  • Os elementos no tipo de coleção de vetores devem ter o tipo de atributo Fractional.

  • Você só pode ter um tipo de coleção de vetores por grupo de atributos do nível InMemory do armazenamento on-line.

  • A dimensão (número de elementos no vetor) do vetor é predeterminada por você e é especificada usando VectorDimension. O limite máximo de dimensão é 8192.

  • Exemplo: você pode ter um vetor como [4.2, -6.3, 4.2], em que o primeiro, o segundo e o terceiro elementos podem representar as posições x, y e z no espaço físico.

Não há limites para o comprimento das coleções, desde que elas não excedam o tamanho máximo de um registro. Para saber o tamanho máximo de um registro, consulte Cotas, regras de nomenclatura e tipos de dados.