Archivio online - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Archivio online

L'archivio online è un datastore a bassa latenza e ad alta disponibilità che fornisce la ricerca in tempo reale delle funzionalità. In genere viene utilizzato per la fornitura di modelli di machine learning (ML). Puoi scegliere tra l'archivio online standard (Standard) o un archivio online di livello in memoria (InMemory), nel momento in cui crei un gruppo di funzionalità. In questo modo, è possibile selezionare il tipo di archiviazione più adatto ai modelli di lettura e scrittura per una particolare applicazione, tenendo conto al contempo delle prestazioni e dei costi. Per maggiori dettagli sui prezzi, consulta la pagina SageMaker dei prezzi di Amazon.

L'archivio online contiene le seguenti opzioni StorageType. Per ulteriori informazioni sui contenuti del negozio online, consulta OnlineStoreConfig.

Tipo di archiviazione di livello standard

Il livello Standard è un datastore gestito a bassa latenza per i gruppi di funzionalità dell'archivio online. Fornisce un rapido recupero dei dati per la fornitura di modelli ML per le tue applicazioni. Standard è il tipo di archiviazione predefinito.

Tipo di archiviazione di livello in memoria

Il livello InMemory è un datastore gestito per i gruppi di funzionalità dell'archivio online che supporta un recupero a latenza molto bassa. Fornisce il recupero dei dati in tempo reale su larga scala per la fornitura di modelli ML utilizzati per applicazioni ad alta velocità di trasmissione effettiva. Il InMemory livello è fornito da Amazon ElastiCache (RedisOSS). Per ulteriori informazioni, consulta What is Amazon ElastiCache (RedisOSS)? .

Il livello InMemory dell'archivio online supporta i tipi di raccolta, ovvero elenco, set e vettore. Per ulteriori informazioni sui tipi di InMemory raccolta, vedereTipi di raccolta.

L'archivio funzionalità offre letture e scritture a bassa latenza nell'archivio online. La latenza dell'applicazione è costituita principalmente da due componenti principali: la latenza dell'infrastruttura o della rete e la latenza del Feature StoreAPI. La riduzione della latenza di rete aiuta a ottenere la latenza più bassa in lettura e scrittura sull'archivio funzionalità. È possibile ridurre la latenza di rete verso Feature Store eseguendo la distribuzione AWS PrivateLink sull'endpoint Feature Store Runtime. Con AWS PrivateLink, puoi accedere privatamente a tutte le API operazioni di Feature Store Runtime dal tuo Amazon Virtual Private Cloud (VPC) in modo scalabile utilizzando gli endpoint dell'interfacciaVPC. Una AWS PrivateLink distribuzione con l'privateDNSEnabledopzione impostata come true:

  • Mantiene tutto il traffico di lettura/scrittura del Feature Store all'interno del tuo. VPC

  • Mantiene il traffico nella stessa zona di disponibilità del client che l'ha originato quando utilizza l'archivio funzionalità. In questo modo si evitano i «salti» tra una AZs riduzione della latenza di rete e l'altra.

Segui i passaggi descritti in Accedere a un AWS servizio utilizzando un VPC endpoint di interfaccia per la configurazione AWS PrivateLink su Feature Store. Il nome del servizio per Feature Store Runtime in AWS PrivateLink ècom.amazonaws.region.sagemaker.featurestore-runtime.

Il negozio online di InMemory livello si ridimensiona automaticamente in base all'utilizzo e alle richieste dello storage. Il dimensionamento automatico può richiedere alcuni minuti per adattarsi a un nuovo modello di utilizzo se cambia rapidamente. Durante il dimensionamento automatico:

  • Le operazioni di scrittura sul gruppo di funzionalità potrebbero ricevere errori di limitazione. Dovresti ritentare le tue richieste qualche minuto più tardi.

  • Le operazioni di lettura sul gruppo di funzionalità potrebbero ricevere errori di limitazione. In questo caso sono adatte le strategie standard di ripetizione dei tentativi.

  • Le operazioni di lettura possono presentare una latenza elevata.

La dimensione massima del gruppo di funzionalità di livello InMemory predefinito è 50 GiB.

Tieni presente che attualmente il livello InMemory supporta solo i gruppi di funzionalità online, non i gruppi di funzionalità online+offline, quindi non è prevista replica tra archivi online e offline per il livello InMemory. Inoltre, il InMemory livello attualmente non supporta le KMS chiavi gestite dal cliente.