Inferenza asincrona

Modalità Focus

Inferenza asincrona - Amazon SageMaker AI

Amazon SageMaker Asynchronous Inference è una funzionalità dell' SageMaker intelligenza artificiale che mette in coda le richieste in entrata e le elabora in modo asincrono. Questa opzione è ideale per richieste con payload di grandi dimensioni (fino a 1 GB), tempi di elaborazione lunghi (fino a un'ora) e requisiti di latenza quasi in tempo reale. L'inferenza asincrona consente di risparmiare sui costi ridimensionando automaticamente il numero di istanze a zero quando non ci sono richieste da elaborare, in modo da pagare solo quando l'endpoint sta elaborando le richieste.

Come funziona

La creazione di un endpoint di inferenza asincrona è simile alla creazione di endpoint di inferenza in tempo reale. Puoi utilizzare i tuoi modelli di SageMaker intelligenza artificiale esistenti e devi solo specificare l'AsyncInferenceConfigoggetto durante la creazione della configurazione dell'endpoint con il campo nell'API. EndpointConfig CreateEndpointConfig Il seguente diagramma mostra l'architettura e il flusso di lavoro di inferenza asincrona.

Diagramma di architettura di inferenza asincrona che mostra come un utente richiama un endpoint.

Per richiamare l'endpoint, devi inserire il payload della richiesta in Amazon S3. È inoltre necessario fornire un puntatore a questo payload come parte della richiesta. InvokeEndpointAsync Al momento della chiamata, l' SageMaker IA mette in coda la richiesta per l'elaborazione e restituisce un identificatore e una posizione di output come risposta. Al momento dell'elaborazione, l' SageMaker intelligenza artificiale colloca il risultato nella posizione Amazon S3. Facoltativamente, puoi scegliere di ricevere notifiche di successo o di errore con Amazon SNS. Per ulteriori informazioni su come configurare le notifiche asincrone, consulta Controllo dei risultati della previsione.

Nota

La presenza di un oggetto di configurazione di inferenza asincrona (AsyncInferenceConfig) nella configurazione dell'endpoint implica che l'endpoint può ricevere solo chiamate asincrone.

Come si inizia?

Se sei un utente alle prime armi di Amazon SageMaker Asynchronous Inference, ti consigliamo di fare quanto segue:

Leggi Operazioni asincrone sugli endpoint per informazioni su come creare, richiamare, aggiornare ed eliminare un endpoint asincrono.
Esplora il notebook di esempio di Asynchronous Inference nel repository aws/. amazon-sagemaker-examples GitHub

Tieni presente che se l'endpoint utilizza una delle funzionalità elencate nella pagina Esclusioni, non puoi utilizzare l’inferenza asincrona.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Risoluzione dei problemi

Operazioni asincrone sugli endpoint

In questa pagina

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie

Inferenza asincrona

Come funziona

Nota

Come si inizia?

In questa pagina

Related resources

Questa pagina ti è stata utile?

Related resources

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?

Diagramma di architettura di inferenza asincrona che mostra come un utente richiama un endpoint.