Tipi di raccolta - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Tipi di raccolta

I tipi di raccolta forniscono un modo per organizzare e strutturare i dati per un recupero e un'analisi efficienti. Vengono utilizzati nei database ML per definire lo schema di un set di dati e i suoi elementi. In Amazon SageMaker Feature Store, i tipi di raccolta supportati includono list, set e vector.

Le raccolte sono un raggruppamento di elementi in cui ogni elemento all'interno della raccolta deve avere lo stesso tipo di funzionalità (String, Integral o Fractional). Ad esempio, una raccolta può contenere elementi dove tutti i tipi di funzionalità degli elementi sono Fractional, ma una raccolta non può contenere alcuni elementi con tipi di funzionalità Fractional e alcuni con tipi di funzionalità String.

Attualmente solo i gruppi di funzionalità dell'archivio online InMemory supportano i tipi di raccolta. Nell'elenco seguente vengono descritte le opzioni del tipo di raccolta.

Elenco: una raccolta ordinata di elementi.

  • La lunghezza dell'elenco è determinata dal numero di elementi presenti nella raccolta.

  • Esempio: è possibile avere un elenco come ['a', 'b', 'a'], perché l'elenco mantiene l'ordine e può avere elementi ripetuti.

Set: una raccolta non ordinata di elementi unici.

  • La lunghezza del set è determinata dal numero di elementi unici presenti nella raccolta.

  • Esempio: non è possibile avere un set come ['a', 'b', 'a'], perché contiene un elemento ripetuto. Il set avrà invece gli elementi ['a', 'b'], perché il set contiene solo elementi unici.

Vettore: un elenco specializzato che rappresenta una matrice di elementi a dimensione fissa. L'ordine degli elementi è significativo, in modo che le posizioni degli elementi rappresentino determinate proprietà dei dati.

  • Gli elementi del tipo di raccolta vettore devono avere il tipo di funzionalità Fractional.

  • È possibile avere un solo tipo di raccolta vettore per gruppo di funzionalità dell'archivio online di livello InMemory.

  • La dimensione (numero di elementi nel vettore) del vettore è predeterminata dall'utente e viene specificata utilizzando VectorDimension. Il limite di dimensione massima è 8192.

  • Esempio: è possibile avere un vettore come [4.2, -6.3, 4.2], in cui il primo, il secondo e il terzo elemento possono rappresentare le posizioni x, y e z nello spazio fisico.

Non ci sono limiti alla lunghezza delle raccolte, purché non superino la dimensione massima di un record. Per la dimensione massima di un record, consulta Quote, regole di denominazione e tipi di dati.