Amazon Comprehend e Application Auto Scaling
Você pode escalar classificação de documentos e endpoints de reconhecimento de entidade do Amazon Comprehend usando políticas de dimensionamento com monitoramento do objetivo e escalabilidade programada.
Use as informações a seguir para ajudar a integrar o Amazon Comprehend com o Application Auto Scaling.
Criação de uma função vinculada ao serviço para Amazon Comprehend
A função vinculada ao serviço a seguir é criada automaticamente em sua Conta da AWS ao inscrever recursos do Amazon Comprehend como destinos escaláveis com o Application Auto Scaling. Essa função permite que o Application Auto Scaling realize as operações suportadas em sua conta. Para ter mais informações, consulte Funções vinculadas ao serviço necessárias para o Application Auto Scaling.
-
AWSServiceRoleForApplicationAutoScaling_ComprehendEndpoint
Principal de serviço primário usado pela função vinculada ao serviço
A função vinculada ao serviço na seção anterior pode ser assumida apenas pelo principal de serviço primário autorizado pelas relações de confiança definidas para a função. A função vinculada ao serviço usada pelo Application Auto Scaling concede acesso aos seguintes principais de serviço primários:
-
comprehend.application-autoscaling.amazonaws.com
Registrar recursos do Amazon Comprehend como destinos escaláveis com o Application Auto Scaling
O Application Auto Scaling requer um destino escalável para que você possa criar políticas de escalabilidade ou ações programadas para uma classificação de documento ou endpoint de reconhecimento de entidade do Amazon Comprehend. Um destino escalável é um recurso que pode ser ampliado ou reduzido com o Application Auto Scaling. Os destinos escaláveis são identificados exclusivamente pela combinação de ID de recurso, dimensão escalável e namespace.
Para configurar o Auto Scaling usando a AWS CLI ou um dos AWS SDKs, é possível usar as seguintes opções:
-
AWS CLI:
Chame o comando register-scalable-target para um endpoint de classificação de documento. O exemplo a seguir registra o número desejado de unidades de inferência a serem usadas pelo modelo para um ponto final de classificação de documentos usando o ARN do endpoint, com uma capacidade mínima de uma unidade de inferência e uma capacidade máxima de três unidades de inferência.
aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:
us-west-2
:123456789012
:document-classifier-endpoint/EXAMPLE
\ --min-capacity1
\ --max-capacity3
Se obtiver êxito, esse comando retornará o ARN do destino escalável.
{ "ScalableTargetARN": "arn:aws:application-autoscaling:
region
:account-id
:scalable-target/1234abcd56ab78cd901ef1234567890ab123" }Chame o comando
register-scalable-target
para um endpoint de reconhecimento de entidade. O exemplo a seguir registra o número desejado de unidades de inferência a serem usadas pelo modelo para um reconhecedor de entidade usando o ARN do ponto de extremidade, com uma capacidade mínima de uma unidade de inferência e uma capacidade máxima de três unidades de inferência.aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --resource-id arn:aws:comprehend:
us-west-2
:123456789012
:entity-recognizer-endpoint/EXAMPLE
\ --min-capacity1
\ --max-capacity3
Se obtiver êxito, esse comando retornará o ARN do destino escalável.
{ "ScalableTargetARN": "arn:aws:application-autoscaling:
region
:account-id
:scalable-target/1234abcd56ab78cd901ef1234567890ab123" } -
AWS SDK:
Chame a operação RegisterScalableTarget e forneça
ResourceId
,ScalableDimension
,ServiceNamespace
,MinCapacity
eMaxCapacity
como parâmetros.
Recursos relacionados
Se você está apenas começando a usar o Application Auto Scaling, pode encontrar informações adicionais úteis sobre como escalar os recursos do Amazon Comprehend na seguinte documentação:
Escalabilidade automática com endpoints no Guia do desenvolvedor do Amazon Comprehend