Aggiorna gli endpoint che utilizzano la scalabilità automatica - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Aggiorna gli endpoint che utilizzano la scalabilità automatica

Quando aggiorni un endpoint, Application Auto Scaling verifica se alcuni dei modelli su quell'endpoint sono obiettivi per l'auto scaling. Se l'aggiornamento modifica il tipo di istanza per qualsiasi modello destinato alla scalabilità automatica, l'aggiornamento non riesce.

Nel AWS Management Console, viene visualizzato un avviso che indica che è necessario annullare la registrazione del modello dal ridimensionamento automatico prima di poterlo aggiornare. Se state tentando di aggiornare l'endpoint chiamando il UpdateEndpointAPI, la chiamata ha esito negativo. Prima di aggiornare l'endpoint, elimina tutte le politiche di scalabilità configurate per esso e annulla la registrazione della variante come destinazione scalabile richiamando l'azione Application Auto DeregisterScalableTargetScaling. API Dopo aver aggiornato l'endpoint, è possibile registrare la variante aggiornata come target scalabile e allegare una politica di scalabilità.

Esiste tuttavia un'eccezione. Se modifichi il modello per una variante configurata per la scalabilità automatica, Amazon SageMaker auto scaling consente l'aggiornamento. Questo perché la modifica del modello in genere non influisce sulle prestazioni in misura sufficiente a modificare il comportamento di scalabilità. Se aggiorni un modello per una variante configurata per la scalabilità automatica, assicurati che la modifica al modello non influisca in modo significativo sulle prestazioni e sul comportamento di scalabilità.

Quando aggiorni gli SageMaker endpoint a cui è applicata la scalabilità automatica, completa i seguenti passaggi:

Per aggiornare un endpoint a cui è applicato il ridimensionamento automatico
  1. Annulla la registrazione dell'endpoint come target scalabile chiamando. DeregisterScalableTarget

  2. Poiché la scalabilità automatica è bloccata mentre è in corso l'operazione di aggiornamento (o se hai disattivato la scalabilità automatica nel passaggio precedente), potresti prendere la precauzione aggiuntiva di aumentare il numero di istanze per l'endpoint durante l'aggiornamento. A tale scopo, aggiorna i conteggi delle istanze per le varianti di produzione ospitate sull'endpoint chiamando. UpdateEndpointWeightsAndCapacities

  3. Chiama DescribeEndpointripetutamente fino a quando il valore del EndpointStatus campo della risposta èInService.

  4. Chiama DescribeEndpointConfigper ottenere i valori della configurazione corrente dell'endpoint.

  5. Crea una nuova configurazione dell'endpoint chiamando. CreateEndpointConfig Per le varianti di produzione in cui desideri mantenere il conteggio o il peso delle istanze esistenti, utilizza lo stesso nome di variante dalla risposta della chiamata DescribeEndpointConfigal passaggio precedente. Per tutti gli altri valori, utilizzate i valori che avete ricevuto come risposta quando avete chiamato DescribeEndpointConfignel passaggio precedente.

  6. Aggiornare l'endpoint chiamando UpdateEndpoint. Specifica la configurazione dell'endpoint creata nella fase precedente come il campo EndpointConfig. Se si desidera mantenere le proprietà di variante come il conteggio delle istanze o il peso, impostare il valore del parametro RetainAllVariantProperties su True. Specifica che le varianti di produzione con lo stesso nome verranno aggiornate con il DesiredInstanceCount più recente dalla risposta dalla chiamata a DescribeEndpoint, indipendentemente dai valori del campo InitialInstanceCount nel nuovo EndpointConfig.

  7. (Facoltativo) Riattiva il ridimensionamento automatico RegisterScalableTargetchiamando e. PutScalingPolicy

Nota

Le fasi 1 e 7 sono necessarie solo se stai aggiornando un endpoint con le seguenti modifiche:

  • Modifica del tipo di istanza per una variante di produzione con scalabilità automatica configurata

  • Rimozione di una variante di produzione con scalabilità automatica configurata.