비디오 프레임 객체 감지를 사용하여 객체 식별 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

비디오 프레임 객체 감지를 사용하여 객체 식별

비디오 프레임 객체 감지 작업 유형을 사용하면 작업자가 경계 상자, 폴리라인, 다각형 또는 키포인트 주석 도구를 사용하여 일련의 비디오 프레임(비디오에서 추출한 이미지)에 있는 물체를 식별하고 찾도록 할 수 있습니다. 선택한 도구에 따라 생성하는 비디오 프레임 작업 유형이 정의됩니다. 예를 들어 바운딩 박스 비디오 프레임 객체 감지 작업 유형 작업자를 사용하여 일련의 비디오 프레임에서 자동차, 자전거, 보행자와 같은 다양한 객체를 식별하고 지역화할 수 있습니다. Amazon SageMaker Ground Truth 콘솔, SageMaker API및 언어별 를 사용하여 비디오 프레임 객체 감지 레이블 지정 작업을 생성할 수 있습니다 AWS SDKs. 자세한 내용은 비디오 프레임 객체 감지 라벨링 작업 생성을 참조하여 원하는 방법을 선택하세요. 라벨링 작업을 생성할 때 선택할 수 있는 주석 도구에 대한 자세한 내용은 Task 유형를 참조하세요.

Ground Truth는 작업자 UI 미리 보기 라벨링 작업을 완료하기 위한 작업자 UI와 도구를 제공합니다.

비디오 객체 감지 조정 태스크 유형을 사용하여 비디오 객체 감지 레이블 지정 작업 시 생성한 주석을 조정하는 작업을 생성할 수 있습니다. 자세한 내용은 비디오 프레임 객체 감지 조정 또는 검증 라벨링 작업 생성 단원을 참조하세요.

작업자 UI 미리 보기

Ground Truth는 작업자에게 비디오 프레임 객체 감지 주석 작업을 완료할 수 있는 웹 사용자 인터페이스 (UI) 를 제공합니다. 콘솔에서 레이블 지정 작업을 생성할 때 작업자 UI를 미리 보고 상호 작용할 수 있습니다. 신규 사용자의 경우 작은 입력 데이터 세트를 사용하여 콘솔을 통해 레이블 지정 작업을 생성하여 작업자 UI를 미리 보고 동영상 프레임, 레이블, 레이블 속성이 예상대로 나타나는지 확인하는 것이 좋습니다.

UI는 작업자에게 다음과 같은 보조 레이블 지정 도구를 제공하여 객체 감지 작업을 완료할 수 있도록 합니다.

  • 작업자는 모든 작업에 대해 다음으로 복사모든 항목에 복사 기능을 사용하여 주석을 다음 프레임 또는 모든 후속 프레임에 각각 복사할 수 있습니다.

  • 경계 상자 도구가 포함된 작업의 경우 작업자는 다음 예측 기능을 사용하여 단일 프레임에 경계 상자를 그린 다음 Ground Truth가 다른 모든 프레임에서 동일한 레이블을 가진 상자의 위치를 예측하도록 할 수 있습니다. 그러면 작업자가 조정하여 예측된 상자 위치를 수정할 수 있습니다.

다음 동영상은 작업자가 바운딩 박스 도구와 함께 작업자 UI를 사용하여 물체 감지 작업을 완료하는 방법을 보여줍니다.

작업자가 객체 감지 작업에 경계 상자 도구를 사용하는 방법을 보여주는 Gif입니다.

비디오 프레임 객체 감지 라벨링 작업 생성

SageMaker 콘솔 또는 CreateLabelingJob API 작업을 사용하여 비디오 프레임 객체 감지 레이블 지정 작업을 생성할 수 있습니다.

이 섹션에서는 비디오 프레임 레이블 지정 작업 참조을 검토하고 사용 중인 입력 데이터 유형과 입력 데이터 세트 연결을 선택했다고 가정합니다.

레이블 지정 작업 생성(콘솔)

의 지침에 따라 SageMaker 콘솔에서 비디오 프레임 객체 추적 작업을 생성하는 방법을 레이블 지정 작업 생성(콘솔) 알아볼 수 있습니다. 10단계에서 작업 범주 드롭다운 목록에서 비디오 - 객체 감지를 선택합니다. 작업 선택에서 카드 중 하나를 선택하여 원하는 작업 유형을 선택합니다.

SageMaker 콘솔에서 비디오 프레임 객체 추적 작업을 생성하는 방법을 보여주는 Gif.

레이블 지정 작업 생성(API)

작업을 사용하여 SageMaker API 객체 감지 레이블 지정 작업을 생성합니다CreateLabelingJob. 이는 모든 에 대해 이 작업을 API 정의합니다 AWS SDKs. 이 작업에 SDKs 지원되는 언어별 목록을 보려면 의 또한 섹션을 참조하세요CreateLabelingJob.

레이블 지정 작업 생성(API)에서는 CreateLabelingJob 연산에 대한 개요를 제공합니다. 다음 지침에 따라 요청을 구성하는 동안 다음을 수행합니다.

  • 에 ARN 대한 를 입력해야 합니다HumanTaskUiArn. arn:aws:sagemaker:<region>:394669845002:human-task-ui/VideoObjectDetection를 사용합니다. <region>을 레이블 지정 작업을 생성 중인 AWS 리전으로 바꿉니다.

    UiTemplateS3Uri 파라미터의 값을 포함하지 마세요.

  • LabelAttributeName-ref에서 끝나야 합니다. 예: video-od-labels-ref.

  • 입력 매니페스트 파일은 비디오 프레임 시퀀스 매니페스트 파일이어야 합니다. SageMaker 콘솔을 사용하여 이 매니페스트 파일을 생성하거나 수동으로 생성하여 Amazon S3에 업로드할 수 있습니다. 자세한 내용은 입력 데이터 설정 단원을 참조하십시오.

  • 개인 또는 공급업체 작업 팀만 사용하여 비디오 프레임 객체 감지 레이블 지정 작업을 생성할 수 있습니다.

  • 레이블 범주 구성 파일에서 레이블, 레이블 범주와 프레임 속성, 작업 유형, 작업자 지침을 지정합니다. 레이블 범주 구성 파일에서 annotationType를 사용하여 작업 유형(경계 상자, 폴리라인, 다각형 또는 키포인트)을 지정합니다. 이 파일을 생성하는 방법에 대한 자세한 내용은 레이블 범주 및 프레임 속성 참조로 범주 구성 파일 레이블 지정 단원을 참조하세요.

  • 주석 전 및 주석 후(ACS) Lambda 함수에 ARNs 대해 미리 정의된 를 제공해야 합니다. 이는 레이블 지정 작업을 생성하는 데 사용하는 AWS 리전에 ARNs 따라 다릅니다.

    • 사전 주석 Lambda를 찾으려면 섹션을 ARN참조하세요PreHumanTaskLambdaArn. 레이블 지정 작업을 생성하는 리전을 사용하여 로 끝ARN나는 올바른 를 찾습니다PRE-VideoObjectDetection.

    • 주석 후 Lambda를 찾으려면 섹션을 ARN참조하세요AnnotationConsolidationLambdaArn. 레이블 지정 작업을 생성하는 리전을 사용하여 로 끝ARN나는 올바른 를 찾습니다ACS-VideoObjectDetection.

  • NumberOfHumanWorkersPerDataObject에 지정된 작업자 수는 1이어야 합니다.

  • 비디오 프레임 레이블 지정 작업에서는 자동 데이터 레이블 지정이 지원되지 않습니다. LabelingJobAlgorithmsConfig에서 파라미터의 값을 지정하지 마세요.

  • 비디오 프레임 객체 추적 레이블 지정 작업을 완료하는 데 몇 시간이 걸릴 수 있습니다. TaskTimeLimitInSeconds에서 이러한 레이블 지정 작업에 대해 더 긴 시간 제한을 지정할 수 있습니다(최대 7일 또는 604800초).

다음은 미국 동부AWS SDK(버지니아 북부) 리전에서 레이블 지정 작업을 생성하기 위한 Python(Boto3) 요청의 예입니다.

response = client.create_labeling_job( LabelingJobName='example-video-od-labeling-job, LabelAttributeName='label', InputConfig={ 'DataSource': { 'S3DataSource': { 'ManifestS3Uri': 's3://amzn-s3-demo-bucket/path/video-frame-sequence-input-manifest.json' } }, 'DataAttributes': { 'ContentClassifiers': [ 'FreeOfPersonallyIdentifiableInformation'|'FreeOfAdultContent', ] } }, OutputConfig={ 'S3OutputPath': 's3://amzn-s3-demo-bucket/prefix/file-to-store-output-data', 'KmsKeyId': 'string' }, RoleArn='arn:aws:iam::*:role/*, LabelCategoryConfigS3Uri='s3://bucket/prefix/label-categories.json', StoppingConditions={ 'MaxHumanLabeledObjectCount': 123, 'MaxPercentageOfInputDatasetLabeled': 123 }, HumanTaskConfig={ 'WorkteamArn': 'arn:aws:sagemaker:us-east-1:*:workteam/private-crowd/*', 'UiConfig': { 'HumanTaskUiArn: 'arn:aws:sagemaker:us-east-1:394669845002:human-task-ui/VideoObjectDetection' }, 'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:PRE-VideoObjectDetection', 'TaskKeywords': [ 'Video Frame Object Detection', ], 'TaskTitle': 'Video frame object detection task', 'TaskDescription': 'Classify and identify the location of objects and people in video frames', 'NumberOfHumanWorkersPerDataObject': 123, 'TaskTimeLimitInSeconds': 123, 'TaskAvailabilityLifetimeInSeconds': 123, 'MaxConcurrentTaskCount': 123, 'AnnotationConsolidationConfig': { 'AnnotationConsolidationLambdaArn': 'arn:aws:lambda:us-east-1:432418664414:function:ACS-VideoObjectDetection' }, Tags=[ { 'Key': 'string', 'Value': 'string' }, ] )

비디오 프레임 객체 감지 조정 또는 검증 라벨링 작업 생성

Ground Truth 콘솔 또는 CreateLabelingJob 를 사용하여 조정 및 확인 레이블 지정 작업을 생성할 수 있습니다API. 조정 및 검증 레이블 지정 작업의 세부 정보와 해당 작업의 생성 방법을 알아보려면 레이블 확인 및 조정을(를) 참조하세요.

출력 데이터 형식

비디오 프레임 객체 감지 레이블 지정 작업을 생성하면 작업자에게 태스크가 전송됩니다. 작업자가 태스크를 완료하면 레이블 지정 작업을 생성할 때 지정한 Amazon S3 출력 위치에 레이블이 기록됩니다. 비디오 프레임 객체 감지 출력 데이터 형식에 대한 자세한 내용은 비디오 프레임 객체 감지 출력 단원을 참조하세요. Ground Truth를 처음 사용할 경우 작업 출력 데이터 레이블 지정에서 Ground Truth 출력 데이터 형식의 세부 정보를 알아보세요.