Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Opzioni endpoint avanzate per l'inferenza con Amazon SageMaker
Con l'inferenza in tempo reale, puoi ottimizzare ulteriormente le prestazioni e i costi con le seguenti opzioni di inferenza avanzate:
-
Endpoint multi-modello— Utilizzate questa opzione se disponete di più modelli che utilizzano lo stesso framework e possono condividere un contenitore. Questa opzione consente di ottimizzare i costi migliorando l'utilizzo degli endpoint e riducendo il sovraccarico di implementazione.
-
Endpoint multi-container— Utilizzate questa opzione se avete più modelli che utilizzano framework diversi e richiedono contenitori propri. Ottieni molti dei vantaggi degli endpoint multimodel e puoi implementare una varietà di framework e modelli.
-
Pipeline di inferenza seriale: utilizzate questa opzione se desiderate ospitare modelli con logica di pre-elaborazione e post-elaborazione dietro un endpoint. Le pipeline di inferenza sono completamente gestite SageMaker e offrono una latenza inferiore perché tutti i container sono ospitati sulle stesse istanze Amazon. EC2