Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Usa lo spostamento del traffico delle Canarie
Con lo spostamento del traffico Canary, puoi testare una parte del tuo traffico dell’endpoint sul nuovo parco istanze, mentre il vecchio parco istanze gestisce il resto del traffico. Questa fase di test è un guardrail di sicurezza che convalida la funzionalità del nuovo parco istanze prima di spostare tutto il traffico verso il nuovo parco istanze. Continui ad avere i vantaggi di un'implementazione blu/verde e la funzionalità Canary aggiunta ti consente di assicurarti che il tuo nuovo parco istanze (verde) sia in grado di gestire l’inferenza prima di consentirgli di gestire il 100% del traffico.
La parte del tuo parco istanze verde che si attiva per ricevere traffico è denominata canary e puoi scegliere la dimensione di questo canary. Tieni presente che la dimensione del canary non deve superare il 50% della capacità del nuovo parco istanze. Una volta terminato il periodo di cottura e non scatta alcun CloudWatch allarme Amazon prestabilito, il resto del traffico si sposta dalla vecchia flotta (blu) a quella verde. Lo spostamento del traffico Canary ti offre maggiore sicurezza durante l'implementazione, poiché qualsiasi problema con il modello aggiornato ha un impatto solo sul canary.
Il diagramma seguente mostra come lo spostamento del traffico Canary gestisce la distribuzione del traffico tra i parchi istanze blu e verdi.
Una volta che l' SageMaker IA rifornisce la flotta verde, SageMaker indirizza una parte del traffico in entrata (ad esempio, il 25%) verso le isole Canarie. Inizia quindi il periodo di cottura, durante il quale gli CloudWatch allarmi monitorano le prestazioni della flotta verde. Durante questo periodo, sia il parco istanze blu che quello verde sono parzialmente attivi e ricevono traffico. Se uno qualsiasi degli allarmi scatta durante il periodo di cottura, l' SageMaker IA avvia un rollback e tutto il traffico ritorna alla flotta blu. Se nessuno degli allarmi viene attivaro, tutto il traffico si sposta verso il parco istanze verde e c’è un ultimo periodo di baking. Se l'ultimo periodo di cottura termina senza far scattare alcun allarme, la flotta verde serve tutto il traffico e l' SageMaker IA interrompe la flotta blu.
Prerequisiti
Prima di configurare una distribuzione con Canary Traffic Shifting, devi creare CloudWatch allarmi Amazon per monitorare le metriche dal tuo endpoint. Gli allarmi sono attivi durante il periodo di baking e, se qualche allarme si attiva, tutto il traffico degli endpoint torna al parco istanze blu. Per sapere come configurare gli CloudWatch allarmi su un endpoint, consulta la pagina dei prerequisiti. Configurazione e monitoraggio del rollback automatico Per ulteriori informazioni sugli CloudWatch allarmi, consulta Using Amazon CloudWatch alarms nella Amazon CloudWatch User Guide.
Configurare lo spostamento del traffico Canary
Una volta che sei pronto per la distribuzione e hai configurato gli CloudWatch allarmi Amazon per il tuo endpoint, puoi utilizzare Amazon SageMaker AI UpdateEndpointAPIo il comando update-endpoint per avviare la AWS CLI distribuzione.
Argomenti
Come aggiornare un endpoint () API
L'esempio seguente UpdateEndpointAPImostra come aggiornare un endpoint con Canary Traffic Shifting.
import boto3 client = boto3.client("sagemaker") response = client.update_endpoint( EndpointName="
<your-endpoint-name>
", EndpointConfigName="<your-config-name>
", DeploymentConfig={ "BlueGreenUpdatePolicy": { "TrafficRoutingConfiguration": { "Type": "CANARY", "CanarySize": { "Type": "CAPACITY_PERCENT", "Value": 30 }, "WaitIntervalInSeconds": 600 }, "TerminationWaitInSeconds": 600, "MaximumExecutionTimeoutInSeconds": 1800 }, "AutoRollbackConfiguration": { "Alarms": [ { "AlarmName": "<your-cw-alarm>
" } ] } } )
Per configurare l’opzione di spostamento del traffico canary, procedi come segue:
Per
EndpointName
, utilizza il nome dell'endpoint esistente che desideri aggiornare.Per
EndpointConfigName
, utilizza il nome della configurazione dell'endpoint che desideri utilizzare.Sotto
DeploymentConfig
eBlueGreenUpdatePolicy
, inTrafficRoutingConfiguration
, imposta il parametroType
suCANARY
. Ciò specifica che l'implementazione utilizza lo spostamento del traffico canary.Nel campo
CanarySize
, puoi modificare la dimensione del canary modificando i parametriType
eValue
. PerType
, usaCAPACITY_PERCENT
, ovvero la percentuale del parco istanze verde che desideri utilizzare come canary, quindi impostaValue
su30
. In questo esempio, utilizzi il 30% della capacità del parco istanze verde come canary. Tieni presente che la dimensione del canary non deve superare il 50% della capacità del nuovo parco istanze.Per
WaitIntervalInSeconds
, utilizza600
. Il parametro indica all' SageMaker IA di attendere il periodo di tempo specificato (in secondi) tra ogni cambio di intervallo. Questo intervallo è la durata del periodo di baking del canary. Nell'esempio precedente, l' SageMaker IA attende 10 minuti dopo il turno canarino e poi completa il secondo e ultimo turno di traffico.Per
TerminationWaitInSeconds
, utilizza600
. Questo parametro indica all' SageMaker IA di attendere il periodo di tempo specificato (in secondi) dopo che la flotta verde è completamente attiva prima di terminare le istanze della flotta blu. In questo esempio, l' SageMaker IA attende 10 minuti dopo l'ultimo periodo di cottura prima di terminare la flotta blu.Per
MaximumExecutionTimeoutInSeconds
, utilizza1800
. Questo parametro imposta il tempo massimo di esecuzione dell’implementazione prima che scada. Nell'esempio precedente, l’implementazione ha un limite di 30 minuti per completare l’esecuzione.All'interno del
Alarms
campo, puoi aggiungere i tuoi CloudWatch allarmi per nome.AutoRollbackConfiguration
Crea una voceAlarmName:
per ogni allarme che desideri utilizzare.<your-cw-alarm>
Come aggiornare un endpoint con una politica di aggiornamento blu/verde esistente () API
Quando si utilizza CreateEndpointAPIper creare un endpoint, è possibile specificare facoltativamente una configurazione di distribuzione da riutilizzare per futuri aggiornamenti degli endpoint. È possibile utilizzare le stesse DeploymentConfig
opzioni dell'esempio precedente. UpdateEndpoint API Non sono state apportate modifiche al CreateEndpoint API comportamento. Specificare la configurazione di implementazione non significa che l’aggiornamento blu/verde sull'endpoint venga eseguito automaticamente.
La possibilità di utilizzare una configurazione di distribuzione precedente si verifica quando si utilizza UpdateEndpointAPIper aggiornare l'endpoint. Quando aggiorni l'endpoint, puoi utilizzare l'opzione RetainDeploymentConfig
per mantenere la configurazione di implementazione specificata durante la creazione dell'endpoint.
Quando chiamate il UpdateEndpointAPI, impostate RetainDeploymentConfig
in modo da True
mantenere le DeploymentConfig
opzioni della configurazione originale dell'endpoint.
response = client.update_endpoint( EndpointName="
<your-endpoint-name>
", EndpointConfigName="<your-config-name>
", RetainDeploymentConfig=True )
Come aggiornare un endpoint () CLI
update-endpoint --endpoint-name
<your-endpoint-name>
--endpoint-config-name<your-config-name>
--deployment-config '"BlueGreenUpdatePolicy": {"TrafficRoutingConfiguration": {"Type": "CANARY", "CanarySize": {"Type": "CAPACITY_PERCENT", "Value": 30}, "WaitIntervalInSeconds": 600}, "TerminationWaitInSeconds": 600, "MaximumExecutionTimeoutInSeconds": 1800}, "AutoRollbackConfiguration": {"Alarms": [{"AlarmName": "<your-alarm>
"}]}'
Per configurare l’opzione di spostamento del traffico canary, procedi come segue:
Per
endpoint-name
, utilizza il nome dell'endpoint che desideri aggiornare.Per
endpoint-config-name
, utilizza il nome della configurazione dell'endpoint che desideri utilizzare.Per, usa un oggetto.
deployment-config
BlueGreenUpdatePolicyJSON
Nota
Se preferite salvare JSON l'oggetto in un file, consultate Generazione AWS CLI dello scheletro e dei parametri di input nella Guida per l'AWS CLI utente.