Aggiornamento di un endpoint serverless - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Aggiornamento di un endpoint serverless

Prima di aggiornare l'endpoint, creare una nuova configurazione endpoint o utilizzare una configurazione endpoint esistente. Nella configurazione endpoint vanno specificate le modifiche per l'aggiornamento. Quindi, puoi aggiornare il tuo endpoint con la console SageMaker AI, l'API o il UpdateEndpoint. AWS CLI Il processo di aggiornamento di un endpoint serverless è identico al processo di aggiornamento di un endpoint in tempo reale. Tieni presente che quando aggiorni l'endpoint, potresti riscontrare partenze a freddo quando effettui richieste all'endpoint, poiché l' SageMaker IA deve reinizializzare il contenitore e il modello.

È possibile aggiornare un endpoint serverless su richiesta con un endpoint serverless con la simultaneità assegnata o modificare il valore Simultaneità assegnata per un endpoint serverless esistente con simultaneità assegnata. In entrambi i casi, sarà necessario creare una nuova configurazione endpoint serverless con il valore desiderato per Simultaneità assegnata e applicare UpdateEndpoint all'endpoint serverless esistente. Per ulteriori informazioni sulla creazione di una nuova configurazione endpoint serverless con Simultaneità assegnata, consultare Creare una configurazione endpoint.

Se si desidera rimuovere Simultaneità assegnata da un endpoint serverless, sarà necessario creare una nuova configurazione endpoint senza specificare alcun valore per Simultaneità assegnata e quindi applicare UpdateEndpoint all'endpoint.

Nota

L'aggiornamento di un endpoint di inferenza in tempo reale a un endpoint serverless su richiesta o a un endpoint serverless con Simultaneità assegnata non è attualmente supportato.

Aggiornamento dell’endpoint

Dopo aver creato una nuova configurazione di endpoint serverless, puoi utilizzare la console di intelligenza artificiale AWS SDK for Python (Boto3)o la console SageMaker AI per aggiornare un endpoint serverless esistente. Nelle sezioni seguenti sono descritti esempi di come aggiornare l'endpoint utilizzando AWS SDK for Python (Boto3) la console di SageMaker intelligenza artificiale.

Per aggiornare l'endpoint (utilizzando Boto3)

L'esempio seguente utilizza il AWS SDK for Python (Boto3)per chiamare il metodo update_endpoint. Specificate almeno i seguenti parametri quando chiamate il metodo:

  • Per EndpointName, usare il nome dell'endpoint che si sta aggiornando.

  • Per EndpointConfigName, utilizzare il nome della configurazione endpoint che si desidera utilizzare per l’aggiornamento.

response = client.update_endpoint( EndpointName="<your-endpoint-name>", EndpointConfigName="<new-endpoint-config>", )

Per aggiornare l'endpoint (tramite la console)

  1. Accedi alla console Amazon SageMaker AI.

  2. Nella scheda di navigazione, scegliere Inferenza.

  3. Dopodiché, scegliere Endpoint.

  4. Nell'elenco degli endpoint, selezionare quello che si desidera aggiornare.

  5. Scegliere Cambia nella sezione Impostazioni della configurazione endpoint.

  6. Per Modifica configurazione endpoint, scegliere Utilizza una configurazione endpoint esistente.

  7. Dall'elenco delle configurazioni endpoint, selezionare quella da utilizzare per l'aggiornamento.

  8. Scegliere Seleziona la configurazione endpoint.

  9. Scegliere Aggiorna endpoint.