As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Use AWS CloudFormation para criar uma política de escalabilidade
O exemplo a seguir mostra como configurar o escalonamento automático do modelo em um endpoint usando o. AWS CloudFormation
Endpoint: Type: "AWS::SageMaker::Endpoint" Properties: EndpointName:
yourEndpointName
EndpointConfigName:yourEndpointConfigName
ScalingTarget: Type: "AWS::ApplicationAutoScaling::ScalableTarget" Properties: MaxCapacity:10
MinCapacity:2
ResourceId: endpoint/my-endpoint
/variant/my-variant
RoleARN:arn
ScalableDimension: sagemaker:variant:DesiredInstanceCount ServiceNamespace: sagemaker ScalingPolicy: Type: "AWS::ApplicationAutoScaling::ScalingPolicy" Properties: PolicyName:my-scaling-policy
PolicyType: TargetTrackingScaling ScalingTargetId: Ref: ScalingTarget TargetTrackingScalingPolicyConfiguration: TargetValue:70.0
ScaleInCooldown:600
ScaleOutCooldown:30
PredefinedMetricSpecification: PredefinedMetricType: SageMakerVariantInvocationsPerInstance
Para obter mais informações, consulte Criar recursos do Application Auto Scaling AWS CloudFormation no Guia do usuário do Application Auto Scaling.