Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Ridimensionamento automatico dei modelli Amazon SageMaker
Amazon SageMaker supporta il ridimensionamento automatico (auto scaling) per i tuoi modelli ospitati. Dimensionamento automatico modifica dinamicamente il numero di istanze assegnate a un modello in risposta alle variazioni nel carico di lavoro. Quando il carico di lavoro aumenta, la scalabilità automatica offre più istanze online. Quando il carico di lavoro diminuisce, la scalabilità automatica rimuove le istanze non necessarie in modo da non pagare per le istanze assegnate che non vengono utilizzate.
Argomenti
- Panoramica della policy sulla scalabilità automatica
- Prerequisiti per la scalabilità automatica
- Configurazione del modello di scalabilità automatica con la console
- Registrazione di un modello
- Definizione di una policy di dimensionamento
- Applicazione di una policy di scalabilità
- Istruzioni per la modifica di una politica di scalabilità
- Disattiva temporaneamente le politiche di scalabilità
- Eliminazione di una policy di dimensionamento
- Controlla lo stato di un'attività di scalabilità descrivendo le attività di scalabilità
- Test del caricamento della configurazione di scalabilità automatica
- Utilizzalo per AWS CloudFormation creare una politica di scalabilità
- Aggiorna gli endpoint che utilizzano la scalabilità automatica
- Eliminare gli endpoint configurati per la scalabilità automatica