훈련된 Amazon Rekognition Custom Labels 모델 실행 - Rekognition

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

훈련된 Amazon Rekognition Custom Labels 모델 실행

모델의 성능이 만족스러우면 사용을 시작할 수 있습니다. 콘솔 또는 AWS SDK를 사용하여 모델을 시작하고 중지할 수 있습니다. 콘솔에는 사용할 수 있는 예제 SDK 작업도 포함되어 있습니다.

추론 단위

모델을 시작할 때 모델에서 사용하는 컴퓨팅 리소스(추론 단위라고도 함)의 수를 지정합니다.

중요

모델 실행 구성 방법에 따라 모델이 실행되는 시간 및 모델이 실행되는 동안 사용하는 추론 단위 수에 대한 요금이 부과됩니다. 예를 들어 두 개의 추론 단위로 모델을 시작하고 8시간 동안 모델을 사용하면 추론 시간 16시간 (실행 시간 8시간* 추론 단위 2개) 에 대한 요금이 부과됩니다. 자세한 정보는 추론 시간을 참조하세요. 명시적으로 모델을 중지하지 않으면 모델로 이미지를 적극적으로 분석하지 않더라도 요금이 부과됩니다.

단일 추론 단위가 지원하는 초당 트랜잭션 수(TPS)는 다음의 영향을 받습니다.

  • 이미지 수준 레이블(분류)을 탐지하는 모델은 일반적으로 객체를 감지하고 경계 상자로 객체의 위치를 파악하는 모델(객체 감지)보다 TPS가 높습니다.

  • 모델의 복잡성

  • 해상도가 높은 이미지는 분석에 더 많은 시간이 필요합니다.

  • 이미지에 객체가 많을수록 분석하는 데 더 많은 시간이 필요합니다.

  • 작은 이미지는 큰 이미지보다 빠르게 분석됩니다.

  • 이미지 바이트로 전달된 이미지는 먼저 Amazon S3 버킷에 이미지를 업로드한 다음 업로드된 이미지를 참조하는 것보다 빠르게 분석됩니다. 이미지 바이트로 전달된 이미지는 4.0MB 미만이어야 합니다. 이미지를 거의 실시간으로 처리하고 이미지 크기가 4.0MB 미만인 경우에는 이미지 바이트를 사용하는 것이 좋습니다. IP 카메라에서 캡처한 이미지를 예로 들 수 있습니다.

  • Amazon S3 버킷에 저장된 이미지를 처리하는 것이 이미지를 다운로드하고 이미지 바이트로 변환한 다음 분석을 위해 이미지 바이트를 전달하는 것보다 빠릅니다.

  • Amazon S3 버킷에 이미 저장된 이미지를 분석하는 것이 이미지 바이트로 전달된 동일한 이미지를 분석하는 것보다 더 빠를 수 있습니다. 이미지 크기가 더 큰 경우 특히 그렇습니다.

DetectCustomLabels에 대한 직접 호출 수가 모델에서 사용하는 추론 단위의 합계가 지원하는 최대 TPS를 초과하는 경우 Amazon Rekognition Custom Labels는 ProvisionedThroughputExceededException 예외를 반환합니다.

추론 단위를 사용한 처리량 관리

애플리케이션의 요구에 따라 모델의 처리량을 늘리거나 줄일 수 있습니다. 처리량을 늘리려면 추가 추론 단위를 사용하십시오. 추론 단위가 추가될 때마다 처리 속도가 추론 단위당 1씩 빨라집니다. 필요한 추론 단위 수를 계산하는 방법에 대한 자세한 내용은 Amazon Rekognition Custom Labels 및 Amazon Lookout for Vision 모델의 추론 단위 계산을 참조하세요. 모델의 지원되는 처리량을 변경하려면 다음 두 가지 옵션이 있습니다.

수동으로 추론 유닛을 추가하거나 제거합니다.

모델을 중지한 다음 필요한 수의 추론 단위로 다시 시작합니다. 이 접근 방식의 단점은 모델을 다시 시작하는 동안 요청을 받을 수 없고 급증하는 수요를 처리하는 데 사용할 수 없다는 것입니다. 모델의 처리량이 안정적이고 사용 사례가 10~20분의 가동 중지 시간을 견딜 수 있는 경우 이 접근 방식을 사용하세요. 예를 들어 주간 일정을 사용하여 모델과의 통화를 일괄 처리하려는 경우를 들 수 있습니다.

추론 단위 자동 규모 조정

모델이 수요 급증을 수용해야 하는 경우 Amazon Rekognition Custom Labels는 모델에서 사용하는 추론 단위 수를 자동으로 규모 조정할 수 있습니다. 수요가 증가하면 Amazon Rekognition Custom Labels는 모델에 추론 단위를 추가하고 수요가 감소하면 추론 단위를 제거합니다.

Amazon Rekognition Custom Labels가 자동으로 모델의 추론 단위를 규모 조정하도록 하려면 모델을 시작하고 MaxInferenceUnits 파라미터를 사용하여 사용할 수 있는 최대 추론 단위 수를 설정하세요. 최대 추론 단위 수를 설정하면 사용 가능한 추론 단위 수를 제한하여 모델 실행 비용을 관리할 수 있습니다. 최대 단위 수를 지정하지 않는 경우 Amazon Rekognition Custom Labels는 처음에 사용한 추론 단위 수만 사용하여 모델을 자동으로 규모 조정하지 않습니다. 최대 추론 단위 수에 대한 자세한 내용은 Service Quotas를 참조하세요.

MinInferenceUnits 파라미터를 사용하여 최소 추론 단위 수를 지정할 수도 있습니다. 이를 통해 모델의 최소 처리량을 지정할 수 있습니다. 여기서 단일 추론 단위는 1시간의 처리 시간을 나타냅니다.

참고

Amazon Rekognition Custom Labels 콘솔에서는 최대 추론 단위 수를 설정할 수 없습니다. 대신 StartProjectVersion 작업에 MaxInferenceUnits 입력 파라미터를 지정할 수 있습니다.

Amazon Rekognition Custom Labels는 모델의 현재 자동 규모 조정 상태를 확인하는 데 사용할 수 있는 다음과 같은 Amazon CloudWatch Logs 지표를 제공합니다.

지표 설명

DesiredInferenceUnits

Amazon Rekognition Custom Labels가 스케일 업 또는 스케일 다운되는 추론 단위의 수입니다.

InServiceInferenceUnits

모델이 사용하는 추론 단위의 수.

DesiredInferenceUnits = InServiceInferenceUnits인 경우 Amazon Rekognition Custom Labels는 현재 추론 단위 수를 규모 조정하지 않습니다.

DesiredInferenceUnits > InServiceInferenceUnits인 경우 Amazon Rekognition Custom Labels는 DesiredInferenceUnits의 값까지 스케일 업됩니다.

DesiredInferenceUnits < InServiceInferenceUnits인 경우 Amazon Rekognition Custom Labels는 DesiredInferenceUnits의 값으로 스케일 다운됩니다.

Amazon Rekognition Custom Labels에서 반환되는 지표 및 필터링 차원에 대한 자세한 내용은 Rekognition용 CloudWatch 지표를 참조하세요.

모델에 대해 요청한 최대 추론 단위 수를 확인하려면 DescribeProjectsVersion을 직접 호출하고 응답에서 MaxInferenceUnits 필드를 확인하세요. 예제 코드는 모델 설명(SDK) 항목을 참조하세요.

가용 영역

Amazon Rekognition Custom Labels는 하나의 AWS 리전 내 여러 가용 영역에 추론 단위를 배포하여 가용성을 높입니다. 자세한 내용은 가용 영역을 참조하세요. 가용 영역 중단 및 추론 단위 장애로부터 프로덕션 모델을 보호하려면 최소 두 개의 추론 단위로 프로덕션 모델을 시작하십시오.

가용 영역이 중단되면 가용 영역의 모든 추론 유닛을 사용할 수 없게 되고 모델 용량이 감소합니다. DetectCustomLabels에 대한 직접 호출은 나머지 추론 단위에 재분배됩니다. 이러한 직접 호출은 나머지 추론 단위의 지원되는 초당 트랜잭션 수(TPS)를 초과하지 않으면 성공합니다. AWS가 가용 영역을 복구하면 추론 유닛이 다시 시작되고 전체 용량이 복원됩니다.

단일 추론 단위에 장애가 발생하는 경우 Amazon Rekognition Custom Labels는 동일한 가용 영역에서 새 추론 단위를 자동으로 시작합니다. 새 추론 단위가 시작되기 전까지는 모델 용량이 줄어듭니다.