Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Inferenza in tempo reale
L'inferenza in tempo reale è ideale per carichi di lavoro di inferenza in cui sono previsti requisiti in tempo reale, interattivi e a bassa latenza. Puoi implementare il tuo modello sui servizi di SageMaker hosting e ottenere un endpoint che può essere utilizzato per l'inferenza. Questi endpoint sono completamente gestiti e supportano il dimensionamento automatico (vedi Ridimensiona automaticamente SageMaker i modelli Amazon).
Argomenti
- Implementa modelli per l'inferenza in tempo reale
- Richiama modelli per l'inferenza in tempo reale
- Gestisci i tuoi endpoint
- Opzioni di hosting
- Ridimensiona automaticamente SageMaker i modelli Amazon
- Hosting dei volumi di storage dell'istanza
- Convalida sicura dei modelli in produzione
- Spiegabilità online con Clarify SageMaker