Opzioni endpoint avanzate per l'inferenza con Amazon SageMaker

Con l'inferenza in tempo reale, puoi ottimizzare ulteriormente le prestazioni e i costi con le seguenti opzioni di inferenza avanzate:

Endpoint multi-modello— Utilizzate questa opzione se disponete di più modelli che utilizzano lo stesso framework e possono condividere un contenitore. Questa opzione consente di ottimizzare i costi migliorando l'utilizzo degli endpoint e riducendo il sovraccarico di implementazione.
Endpoint multi-container— Utilizzate questa opzione se avete più modelli che utilizzano framework diversi e richiedono contenitori propri. Ottieni molti dei vantaggi degli endpoint multimodel e puoi implementare una varietà di framework e modelli.
Pipeline di inferenza seriale: utilizzate questa opzione se desiderate ospitare modelli con logica di pre-elaborazione e post-elaborazione dietro un endpoint. Le pipeline di inferenza sono completamente gestite SageMaker e offrono una latenza inferiore perché tutti i container sono ospitati sulle stesse istanze Amazon. EC2

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Opzioni di inferenza

Passaggi successivi