대상 추적 - Amazon Comprehend

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

대상 추적

대상 추적을 사용하면 사용량에 따라 용량에 맞게 엔드포인트 프로비저닝을 조정할 수 있습니다. 사용 용량이 프로비저닝된 용량의 목표 백분율 내에 있도록 추론 단위 수가 자동으로 조정됩니다. 대상 추적을 사용하여 문서 분류 엔드포인트 및 개체 인식기 엔드포인트의 일시적인 사용 급증을 수용할 수 있습니다. 자세한 내용은 애플리케이션 Auto Scaling의 대상 추적 조정 정책을 참조하세요.

참고

다음은 Unix, Linux, macOS용 형식으로 지정된 예제입니다. Windows의 경우 각 줄의 끝에 있는 백슬래시(\) Unix 연속 문자를 캐럿(^)으로 바꿉니다.

대상 추적 설정

엔드포인트에 대한 대상 추적을 설정하려면 명령을 사용하여 AWS CLI 확장 가능한 대상을 등록한 다음 조정 정책을 생성합니다. 확장 가능 대상은 추론 단위를 엔드포인트 프로비저닝을 조정하는 데 사용되는 리소스로 정의하고, 조정 정책은 프로비저닝된 용량의 Auto Scaling을 제어하는 지표를 정의합니다.

대상 추적을 설정하려면
  1. 확장 가능 대상을 등록합니다. 다음 예에서는 확장 가능 대상을 등록하여 최소 용량은 추론 단위 1개, 최대 용량은 추론 단위 2개로 엔드포인트 프로비저닝을 조정합니다.

    문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2

    엔터티 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

    aws application-autoscaling register-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --min-capacity 1 \ --max-capacity 2
  2. 확장 가능한 대상의 등록을 확인하려면 다음 AWS CLI 명령을 사용합니다.

    aws application-autoscaling describe-scalable-targets \ --service-namespace comprehend \ --resource-id endpoint ARN
  3. 조정 정책을 위한 대상 추적 구성을 생성하고 구성을 config.json이라는 파일에 저장합니다. 다음은 InferenceUtilization 지표를 70%로 유지하는 것을 대상으로 하는 문서 분류 엔드포인트에 대한 대상 추적 구성의 예입니다.

    { "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:region:account-id:document-classifier-endpoint/name" } ], "Statistic": "Sum", "Unit": "Percent" } }

    다음은 엔터티 인식기 엔드포인트의 예입니다.

    { "TargetValue": 70, "CustomizedMetricSpecification": { "MetricName": "InferenceUtilization", "Namespace": "MyNamespace", "Dimensions": [ { "Name": "EndpointArn", "Value": "arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name" } ], "Statistic": "Sum", "Unit": "Percent" } }
  4. 조정 정책을 생성합니다. 다음 예제에서는 config.json 파일에 정의된 대상 추적 구성을 기반으로 조정 정책을 생성합니다.

    문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

    엔터티 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

    aws application-autoscaling put-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \ --policy-type TargetTrackingScaling \ --target-tracking-scaling-policy-configuration file://config.json

고려 사항

Comprehend 엔드포인트와 함께 대상 추적을 사용하는 경우 다음 고려 사항이 적용됩니다.

  • 엔드포인트 지표는 성공적인 요청에 대해서만 내보내집니다. 내부 서버 오류 또는 고객 오류로 인해 제한되거나 실패한 요청의 경우 지표가 표시되지 않습니다.

  • 데이터 포인트가 누락되면 백업 CloudWatch 경보 상태가 로 변경됩니다INSUFFICIENT_DATA . 이 경우 Application Auto Scaling은 엔드포인트를 확장할 수 없습니다.

  • 지표 수학은 이러한 제한 사항을 해결하는 데 도움이 될 수 있습니다. 예를 들어 지표가 보고되지 않을 때 0의 값을 사용하려면 m1가 지표인 FILL(m1,0) 함수를 사용합니다. 구성이 예상대로 작동하는지 테스트하는 것이 중요합니다. 추가 옵션은 지표 수학을 사용하여 대상 추적 정책 생성을 참조하세요.

대상 추적 제거

엔드포인트의 대상 추적을 제거하려면 명령을 사용하여 AWS CLI 조정 정책을 삭제한 다음 확장 가능한 대상의 등록을 취소합니다.

대상 추적을 제거하려면
  1. 조정 정책을 삭제합니다. 다음 예제에서는 지정한 조정 정책을 삭제합니다.

    문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy \

    엔터티 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

    aws application-autoscaling delete-scaling-policy \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits \ --policy-name TestPolicy
  2. 확장 가능 목표의 등록을 취소합니다. 다음 예제는 지정된 확장 가능 대상의 등록을 취소합니다.

    문서 분류 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:document-classifier-endpoint/name \ --scalable-dimension comprehend:document-classifier-endpoint:DesiredInferenceUnits

    엔터티 인식기 엔드포인트의 경우 다음 AWS CLI 명령을 사용합니다.

    aws application-autoscaling deregister-scalable-target \ --service-namespace comprehend \ --resource-id arn:aws:comprehend:region:account-id:entity-recognizer-endpoint/name \ --scalable-dimension comprehend:entity-recognizer-endpoint:DesiredInferenceUnits