Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Scalabilità automatica con endpoint
Invece di regolare manualmente il numero di unità di inferenza fornite per gli endpoint di classificazione dei documenti e gli endpoint di riconoscimento delle entità, puoi utilizzare la scalabilità automatica per impostare automaticamente il provisioning degli endpoint in base alle tue esigenze di capacità.
Esistono due modi per utilizzare la scalabilità automatica per regolare il numero di unità di inferenza fornite per l'endpoint:
-
Monitoraggio degli obiettivi: imposta la scalabilità automatica per adattare il provisioning degli endpoint alle esigenze di capacità in base all'utilizzo.
-
Dimensionamento programmato: imposta la scalabilità automatica per adattare il provisioning degli endpoint alle esigenze di capacità secondo una pianificazione specifica.
È possibile impostare il ridimensionamento automatico solo con AWS Command Line Interface (AWS CLI). Per ulteriori informazioni sull'auto scaling, consulta What is Application Auto Scaling?