Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Ridimensiona automaticamente SageMaker i modelli Amazon
Amazon SageMaker supporta il ridimensionamento automatico (auto scaling) per i tuoi modelli ospitati. Dimensionamento automatico modifica dinamicamente il numero di istanze assegnate a un modello in risposta alle variazioni nel carico di lavoro. Quando il carico di lavoro aumenta, la scalabilità automatica offre più istanze online. Quando il carico di lavoro diminuisce, la scalabilità automatica rimuove le istanze non necessarie in modo da non pagare per le istanze assegnate che non vengono utilizzate.
Argomenti
- Panoramica della scalabilità automatica
- Configurazione del modello di scalabilità automatica con la console
- Registrazione di un modello
- Definizione di una policy di dimensionamento
- Applicazione di una policy di scalabilità
- Modifica di una policy di dimensionamento
- Eliminazione di una policy di dimensionamento
- Controlla lo stato di un'attività di scalabilità descrivendo le attività di scalabilità
- Test del caricamento della configurazione di scalabilità automatica
- Utilizzalo per AWS CloudFormation creare una politica di scalabilità
- Aggiorna o elimina gli endpoint che utilizzano la scalabilità automatica