Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Controlla lo stato di un'attività di scalabilità descrivendo le attività di scalabilità
Puoi controllare lo stato di un'attività di scalabilità per il tuo endpoint con scalabilità automatica descrivendo le attività di scalabilità. Application Auto Scaling fornisce informazioni descrittive sulle attività di scalabilità nello spazio dei nomi specificato delle sei settimane precedenti. Per ulteriori informazioni, vedere Scaling activities for Application Auto Scaling nella Application Auto Scaling User Guide.
Per verificare lo stato di un'attività di ridimensionamento, utilizzate il comando. describe-scaling-activities Non è possibile controllare lo stato di un'attività di scalabilità utilizzando la console.
Argomenti
Descrivi le attività di ridimensionamento ()AWS CLI
Per descrivere le attività di scalabilità per tutte le risorse SageMaker AI registrate con Application Auto Scaling, usa describe-scaling-activitiesil comando, sagemaker
specificando l'opzione. --service-namespace
aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker
Per descrivere le attività di scalabilità per una risorsa specifica, includi l'opzione. --resource-id
aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
L'esempio seguente mostra l'output prodotto quando si esegue questo comando.
{
"ActivityId": "activity-id",
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/my-endpoint/variant/my-variant",
"ScalableDimension": "sagemaker:variant:DesiredInstanceCount",
"Description": "string",
"Cause": "string",
"StartTime": timestamp,
"EndTime": timestamp,
"StatusCode": "string",
"StatusMessage": "string"
}
Identifica le attività di scalabilità bloccate dall'istanza quotas ()AWS CLI
Quando esegui la scalabilità orizzontale (aggiungi altre istanze), potresti raggiungere la quota di istanze a livello di account. Puoi usare il describe-scaling-activitiescomando per verificare se hai raggiunto la quota di istanza. Quando si supera la quota, la scalabilità automatica viene bloccata.
Per verificare se hai raggiunto la quota di istanza, usa il describe-scaling-activitiescomando e specifica l'ID della risorsa per l'--resource-id
opzione.
aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
All'interno della sintassi return, controlla le chiavi StatusCode e StatusMessage e i valori associati. StatusCode
restituitiFailed
. All'interno di StatusMessage
è presente un messaggio che indica che è stata raggiunta la quota di servizio a livello di account. Di seguito è riportato un esempio di come tale messaggio potrebbe presentarsi:
{
"ActivityId": "activity-id",
"ServiceNamespace": "sagemaker",
"ResourceId": "endpoint/my-endpoint/variant/my-variant",
"ScalableDimension": "sagemaker:variant:DesiredInstanceCount",
"Description": "string",
"Cause": "minimum capacity was set to 110",
"StartTime": timestamp,
"EndTime": timestamp,
"StatusCode": "Failed",
"StatusMessage": "Failed to set desired instance count to 110. Reason: The
account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000
Instances, with current utilization of 997 Instances and a request delta
of 20 Instances. Please contact AWS support to request an increase for this
limit. (Service: AmazonSageMaker; Status Code: 400;
Error Code: ResourceLimitExceeded; Request ID: request-id)."
}