Opzioni endpoint avanzate per l'inferenza con Amazon SageMaker - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Opzioni endpoint avanzate per l'inferenza con Amazon SageMaker

Con l'inferenza in tempo reale, puoi ottimizzare ulteriormente le prestazioni e i costi con le seguenti opzioni di inferenza avanzate:

  • Endpoint multi-modello— Utilizzate questa opzione se disponete di più modelli che utilizzano lo stesso framework e possono condividere un contenitore. Questa opzione consente di ottimizzare i costi migliorando l'utilizzo degli endpoint e riducendo il sovraccarico di implementazione.

  • Endpoint multi-container— Utilizzate questa opzione se avete più modelli che utilizzano framework diversi e richiedono contenitori propri. Ottieni molti dei vantaggi degli endpoint multimodel e puoi implementare una varietà di framework e modelli.

  • Pipeline di inferenza seriale: utilizzate questa opzione se desiderate ospitare modelli con logica di pre-elaborazione e post-elaborazione dietro un endpoint. Le pipeline di inferenza sono completamente gestite SageMaker e offrono una latenza inferiore perché tutti i container sono ospitati sulle stesse istanze Amazon. EC2