As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Registrar um modelo
Antes de adicionar uma política de escalabilidade ao seu modelo, primeiro você deve registrar seu modelo para escalonamento automático e definir os limites de escalabilidade para o modelo.
Os procedimentos a seguir abordam como registrar um modelo (variante de produção) para escalonamento automático usando o AWS Command Line Interface (AWS CLI) ou o Application API Auto Scaling.
Registrar um modelo (AWS CLI)
Para registrar sua variante de produção, use o register-scalable-targetcomando com os seguintes parâmetros:
-
--service-namespace
—Defina esse valor comosagemaker
. -
--resource-id
—O identificador de recurso para o modelo (especificamente, a variante de produção). Para esse parâmetro, o tipo de recurso éendpoint
e o identificador exclusivo é o nome da variante de produção. Por exemplo,endpoint/
.my-endpoint
/variant/my-variant
-
--scalable-dimension
—Defina esse valor comosagemaker:variant:DesiredInstanceCount
. -
--min-capacity
— O número mínimo de instâncias. Este valor deve ser definido como 1, pelo menos. Além disso, deve ser igual ou menor que o valor especificado paramax-capacity
. -
--max-capacity
— O número máximo de instâncias. Este valor deve ser definido como 1, pelo menos. Além disso, deve ser igual ou maior que o valor especificado paramin-capacity
.
O exemplo a seguir mostra como registrar uma variante chamada
, em execução no my-variant
endpoint, que pode ser escalada dinamicamente para ter de uma a oito instâncias.my-endpoint
aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
\ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity1
\ --max-capacity8
Registrar um modelo (Application Auto ScalingAPI)
Para registrar seu modelo no Application Auto Scaling, use a ação RegisterScalableTargetApplication Auto API Scaling com os seguintes parâmetros:
-
ServiceNamespace
—Defina esse valor comosagemaker
. -
ResourceID
—O identificador de recurso da variante de produção. Para esse parâmetro, o tipo de recurso éendpoint
e o identificador exclusivo é o nome da variante. Por exemplo,endpoint/
.my-endpoint
/variant/my-variant
-
ScalableDimension
—Defina esse valor comosagemaker:variant:DesiredInstanceCount
. -
MinCapacity
— O número mínimo de instâncias. Este valor deve ser definido como 1, pelo menos. Além disso, deve ser igual ou menor que o valor especificado paraMaxCapacity
. -
MaxCapacity
— O número máximo de instâncias. Este valor deve ser definido como 1, pelo menos. Além disso, deve ser igual ou maior que o valor especificado paraMinCapacity
.
O exemplo a seguir mostra como registrar uma variante chamada
, em execução no my-variant
endpoint, que pode ser escalada dinamicamente para usar de uma a oito instâncias.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/
my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity":1
, "MaxCapacity":8
}