이미지 분류 작업 생성(다중 레이블) - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

이미지 분류 작업 생성(다중 레이블)

작업자가 이미지의 여러 객체를 분류해야 하는 경우 Amazon SageMaker Ground Truth 다중 레이블 이미지 분류 레이블 지정 작업을 사용하세요. 예를 들어, 다음 이미지에는 개와 고양이가 있습니다. 다중 레이블 이미지 분류를 사용하여 "개" 및 "고양이" 레이블을 이 이미지에 연결할 수 있습니다. 다음 페이지에서는 이미지 분류 작업 생성에 대한 정보를 제공합니다.

사진 제공: Unsplash, Anusha Barwa

다중 레이블 이미지 분류 작업을 수행할 때 작업자는 적용 가능한 모든 레이블을 선택해야 하며, 최소 하나 이상의 레이블은 선택해야 합니다. 이 작업 유형을 사용하여 작업을 생성할 때 최대 50개의 레이블 범주를 제공할 수 있습니다.

콘솔에서 레이블 지정 작업을 생성할 경우, 이미지에 레이블이 적용되지 않으면 Ground Truth가 "없음" 범주를 제공하지 않습니다. 작업자에게 이 옵션을 제공하려면 다중 레이블 이미지 분류 작업을 생성할 때 "없음" 또는 "기타"와 유사한 레이블을 포함합니다.

작업자가 각 이미지에 대해 단일 레이블을 선택하도록 제한하려면 이미지 분류 레이블 작업 생성(단일 레이블) 작업 유형을 사용합니다.

중요

이 작업 유형에서 고유한 매니페스트 파일을 생성할 경우, "source-ref"를 사용하여 Amazon S3에서 레이블을 지정할 각 이미지의 위치를 식별하세요. 자세한 내용은 입력 데이터 섹션을 참조하세요.

다중 레이블 이미지 분류 레이블 지정 작업 생성(콘솔)

지침에 따라 SageMaker AI 콘솔에서 다중 레이블 이미지 분류 레이블 지정 작업을 생성하는 방법을 레이블 지정 작업 생성(콘솔) 알아볼 수 있습니다. 10단계에서는 작업 범주 드롭다운 메뉴에서 이미지를 선택하고 작업 유형으로 이미지 분류(다중 레이블)를 선택하세요.

Ground Truth는 레이블 지정 작업에서 다음과 유사한 작업자 UI를 제공합니다. 콘솔에서 레이블 지정 작업을 생성할 때 작업자가 작업을 완료하는 데 도움이 되는 지침과 작업자가 선택할 수 있는 레이블을 지정합니다.

Ground Truth에서 제공하는 레이블 지정 작업에 대한 작업자 UI 예제입니다.

다중 레이블 이미지 분류 레이블 지정 작업 생성(API)

다중 레이블 이미지 분류 레이블 지정 작업을 생성하려면 SageMaker API 연산 CreateLabelingJob을 사용하세요. 이 API는 모든 AWS SDKs에 대해이 작업을 정의합니다. 이 작업에 지원되는 언어별 SDK 목록을 보려면 CreateLabelingJob참고 항목 섹션을 검토하세요.

레이블 지정 작업 생성(API)의 지침에 따라 요청을 구성하는 동안 다음을 수행합니다.

  • 이 작업 유형에 대한 주석 전 Lambda 함수는 PRE-ImageMultiClassMultiLabel로 끝납니다. 해당 리전의 주석 전 Lambda ARN을 찾으려면 PreHumanTaskLambdaArn을 참조하세요.

  • 이 작업 유형에 대한 주석 통합 Lambda 함수는 ACS-ImageMultiClassMultiLabel로 끝납니다. 해당 리전에 대한 주석 통합 Lambda ARN을 찾으려면 AnnotationConsolidationLambdaArn을 참조하세요.

다음은 미국 동부(버지니아 북부) 리전에 레이블 지정 작업을 생성하는 AWS Python SDK(Boto3) 요청의 예시입니다. 빨간색으로 된 모든 파라미터는 사양과 리소스로 대체해야 합니다.

response = client.create_labeling_job( LabelingJobName='example-multi-label-image-classification-labeling-job, LabelAttributeName='label', InputConfig={ 'DataSource': { 'S3DataSource': { 'ManifestS3Uri': 's3://bucket/path/manifest-with-input-data.json' } }, 'DataAttributes': { 'ContentClassifiers': [ 'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent', ] } }, OutputConfig={ 'S3OutputPath': 's3://bucket/path/file-to-store-output-data', 'KmsKeyId': 'string' }, RoleArn='arn:aws:iam::*:role/*, LabelCategoryConfigS3Uri='s3://bucket/path/label-categories.json', StoppingConditions={ 'MaxHumanLabeledObjectCount': 123, 'MaxPercentageOfInputDatasetLabeled': 123 }, HumanTaskConfig={ 'WorkteamArn': 'arn:aws:sagemaker:region:*:workteam/private-crowd/*', 'UiConfig': { 'UiTemplateS3Uri': 's3://bucket/path/worker-task-template.html' }, 'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-ImageMultiClassMultiLabel', 'TaskKeywords': [ 'Image Classification', ], 'TaskTitle': 'Multi-label image classification task', 'TaskDescription': 'Select all labels that apply to the images shown', 'NumberOfHumanWorkersPerDataObject': 123, 'TaskTimeLimitInSeconds': 123, 'TaskAvailabilityLifetimeInSeconds': 123, 'MaxConcurrentTaskCount': 123, 'AnnotationConsolidationConfig': { 'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-ImageMultiClassMultiLabel' }, Tags=[ { 'Key': 'string', 'Value': 'string' }, ] )

다중 레이블 이미지 분류를 위한 템플릿 제공

API를 사용하여 레이블 지정 작업을 생성하는 경우 UiTemplateS3Uri의 작업자 태스크 템플릿을 제공해야 합니다. 다음 템플릿을 복사하고 수정합니다. short-instructions, full-instructionsheader만 수정합니다.

이 템플릿을 S3에 업로드하고 UiTemplateS3Uri에서 이 파일에 대한 S3 URI를 제공합니다.

<script src="https://assets.crowd.aws/crowd-html-elements.js"></script> <crowd-form> <crowd-image-classifier-multi-select name="crowd-image-classifier-multi-select" src="{{ task.input.taskObject | grant_read_access }}" header="Please identify all classes in image" categories="{{ task.input.labels | to_json | escape }}" > <full-instructions header="Multi Label Image classification instructions"> <ol><li><strong>Read</strong> the task carefully and inspect the image.</li> <li><strong>Read</strong> the options and review the examples provided to understand more about the labels.</li> <li><strong>Choose</strong> the appropriate labels that best suit the image.</li></ol> </full-instructions> <short-instructions> <h3><span style="color: rgb(0, 138, 0);">Good example</span></h3> <p>Enter description to explain the correct label to the workers</p> <h3><span style="color: rgb(230, 0, 0);">Bad example</span></h3> <p>Enter description of an incorrect label</p> </short-instructions> </crowd-image-classifier-multi-select> </crowd-form>

다중 레이블 이미지 분류 출력 데이터

다중 레이블 이미지 분류 레이블 지정 작업을 생성하고 나면 출력 데이터가 API 사용 시 S3OutputPath 파라미터에 지정된 Amazon S3 버킷에 위치하거나, 콘솔의 작업 개요 섹션의 출력 데이터세트 위치 필드에 위치하게 됩니다.

Ground Truth에서 생성된 출력 매니페스트 파일 및 Ground Truth에서 출력 데이터 저장에 사용하는 파일 구조에 대한 자세한 내용은 작업 출력 데이터 레이블 지정을(를) 참조하세요.

다중 레이블 이미지 분류 레이블 지정 작업에 대한 출력 매니페스트 파일의 예제를 보려면 다중 레이블 분류 작업 출력 섹션을 참조하세요.