스트리밍 레이블 지정 작업으로 데이터 전송 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

스트리밍 레이블 지정 작업으로 데이터 전송

입력 매니페스트 파일을 사용하여 레이블 지정 작업을 생성할 때 스트리밍 레이블 지정 작업에 입력 데이터를 선택적으로 한 번 제출할 수 있습니다. 레이블 지정 작업이 시작되고 상태가 이면 Amazon SNS 입력 주제와 Amazon S3 이벤트 알림을 사용하여 레이블 지정 작업에 실시간으로 새 데이터 객체를 제출할 InProgress수 있습니다.

레이블 지정 작업 시작 시 데이터 객체 제출(1회):

  • 입력 매니페스트 파일 사용 - 스트리밍 레이블 지정 작업을 생성할 ManifestS3Uri 때 선택적으로 Amazon S3URI에서 입력 매니페스트 파일을 지정할 수 있습니다. Ground Truth는 레이블 지정 작업이 시작되는 즉시 레이블 지정을 위해 작업자에게 매니페스트 파일의 각 데이터 객체를 보냅니다. 자세한 내용은 매니페스트 파일 생성(선택 사항) 단원을 참조하세요.

    스트리밍 레이블 지정 작업 생성 요청을 제출하면 Initializing 상태가 됩니다. 레이블 지정 작업이 활성화되면 상태가 InProgress로 변경되고 시작할 때 실시간 옵션을 사용하면 레이블 지정을 위한 추가 데이터 객체를 제출할 수 있습니다.

실시간 데이터 객체 제출:

  • Amazon SNS 메시지를 사용하여 데이터 객체 전송 - Amazon SNS 메시지를 전송하여 Ground Truth 새 데이터 객체를 레이블로 전송할 수 있습니다. 스트리밍 레이블 지정 작업을 생성할 때 생성하고 지정하는 Amazon SNS 입력 주제에 이 메시지를 보냅니다. 자세한 내용은 Amazon을 사용하여 데이터 객체 전송 SNS 단원을 참조하십시오.

  • Amazon S3 버킷에 데이터 객체를 배치하여 전송 - Amazon S3 버킷에 새 데이터 객체를 추가할 때마다 Ground Truth에 해당 객체를 처리하여 레이블을 지정하라는 메시지를 표시할 수 있습니다. 이렇게 하려면 버킷에 이벤트 알림을 추가하여 해당 버킷에 새 객체가 추가(또는 에서 생성)될 때마다 Amazon SNS 입력 주제를 알립니다. 자세한 내용은 Amazon S3를 사용하여 데이터 객체 전송 단원을 참조하십시오. 텍스트 분류 및 명명된 주체 인식과 같은 텍스트 기반 레이블 지정 작업에는 이 옵션을 사용할 수 없습니다.

    중요

    Amazon S3 구성을 사용하는 경우 입력 데이터 구성 및 출력 데이터에 동일한 Amazon S3 위치를 사용하지 마세요. 레이블 지정 작업을 생성할 때 출력 데이터의 S3 접두사를 지정합니다.

Amazon을 사용하여 데이터 객체 전송 SNS

Amazon Simple Notification Service(Amazon )를 사용하여 스트리밍 레이블 지정 작업으로 데이터 객체를 전송할 수 있습니다SNS. AmazonSNS은 엔드포인트(예: 이메일 주소 또는 AWS Lambda 함수)와의 메시지 전송을 조정하고 관리하는 웹 서비스입니다. Amazon SNS 주제는 둘 이상의 엔드포인트 간의 통신 채널 역할을 합니다. AmazonSNS을 사용하여 의 CreateLabelingJob 파라미터에 지정된 주제로 새 데이터 객체를 보내거나 게시합니다SnsTopicArnInputConfig. 이러한 메시지의 형식은 입력 매니페스트 파일의 한 줄과 동일합니다.

예를 들어, 텍스트를 입력 주제에 게시하여 활성 텍스트 분류 레이블 지정 작업에 텍스트를 보낼 수 있습니다. 게시된 메시지는 다음과 유사할 수 있습니다.

{"source": "Lorem ipsum dolor sit amet"}

새 이미지 객체를 이미지 분류 레이블 지정 작업에 보내려면 메시지가 다음과 비슷할 수 있습니다.

{"source-ref": "s3://amzn-s3-demo-bucket/example-image.jpg"}
참고

Amazon SNS 메시지에 사용자 지정 중복 제거 IDs 및 중복 제거 키를 포함할 수도 있습니다. 자세한 내용은 중복 메시지 처리을 참조하십시오.

Ground Truth가 스트리밍 레이블 지정 작업을 생성하면 Amazon SNS 입력 주제를 구독합니다.

Amazon S3를 사용하여 데이터 객체 전송

Amazon SNS 이벤트 알림으로 구성된 Amazon S3 버킷에 배치하여 하나 이상의 새 데이터 객체를 스트리밍 레이블 지정 작업에 보낼 수 있습니다. 버킷에 새 객체가 생성될 때마다 Amazon SNS 입력 주제에 알리도록 이벤트를 설정할 수 있습니다. 의 CreateLabelingJob 파라미터에 동일한 Amazon SNS 입력 주제를 지정해야 합니다SnsTopicArnInputConfig.

Amazon S3 버킷이 Amazon 에 알림을 보내도록 구성할 때마다 SNSGround Truth는 테스트 이벤트인 를 게시"s3:TestEvent"하여 주제가 존재하고 지정된 Amazon S3 버킷의 소유자가 지정된 주제에 게시할 수 있는 권한이 있는지 확인합니다. 스트리밍 레이블 지정 작업을 시작하기 SNS 전에 Amazon S3와 Amazon S3 연결을 설정하는 것이 좋습니다. 그렇지 않으면 이 테스트 이벤트가 데이터 객체로 등록되고 레이블을 지정하기 위해 Ground Truth로 전송될 수 있습니다.

중요

Amazon S3 구성을 사용하는 경우 입력 데이터 구성 및 출력 데이터에 동일한 Amazon S3 위치를 사용하지 마세요. 레이블 지정 작업을 생성할 때 출력 데이터의 S3 접두사를 지정합니다.

이미지 기반 레이블 지정 작업의 경우 Ground Truth는 모든 S3 버킷에 CORS 정책이 연결되도록 요구합니다. 자세한 내용은 CORS 입력 이미지 데이터에 대한 요구 사항을 참조하십시오.

Amazon S3 버킷을 구성하고 레이블 지정 작업을 생성한 후에는 버킷에 객체를 추가하고 Ground Truth가 해당 객체를 작업자에게 보내거나 Amazon SQS 대기열에 배치할 수 있습니다.

자세한 내용은 Amazon S3 버킷 이벤트 알림 설정을 참조하십시오.

중요

텍스트 분류 및 명명된 주체 인식과 같은 텍스트 기반 레이블 지정 작업에는 이 옵션을 사용할 수 없습니다.