기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
레이블 지정을 위한 데이터 선택
Amazon SageMaker 콘솔을 사용하여 레이블 지정을 위해 데이터 세트의 일부를 선택할 수 있습니다. 데이터는 Amazon S3 버킷에 저장해야 합니다. 여기에는 다음과 같은 3가지 옵션이 있습니다.
-
전체 데이터 세트 사용
-
데이터 세트의 무작위로 선택된 샘플 선택
-
쿼리를 사용하여 데이터 세트의 하위 세트 지정
레이블 지정 작업 생성을 선택한 후 SageMaker 콘솔
전체 데이터 세트 사용
전체 데이터 세트를 사용하도록 선택한 경우 데이터 객체에 대한 매니페스트 파일을 제공해야 합니다. 매니페스트 파일이 포함된 Amazon S3 버킷의 경로를 제공하거나 SageMaker 콘솔을 사용하여 파일을 생성할 수 있습니다. 콘솔을 사용하여 매니페스트 파일을 생성하는 방법은 레이블 지정 작업을 위한 데이터 설정 자동화 단원을 참조하세요.
임의 샘플 선택
데이터의 임의 하위 세트에 레이블을 지정하려면 임의 샘플을 선택합니다. 데이터 세트는 입력 데이터 세트 위치 필드에 지정된 Amazon S3 버킷에 저장됩니다.
샘플에 포함할 데이터 객체의 백분율을 지정한 후 하위 집합 생성을 선택합니다. 레이블 지정 작업에 대한 데이터 객체를 SageMaker 무작위로 선택합니다. 객체를 선택한 후 이 하위 세트 사용을 선택합니다.
SageMaker 는 선택한 데이터 객체에 대한 매니페스트 파일을 생성합니다. 또한 입력 데이터 세트 위치 필드의 값이 새 매니페스트 파일을 가리키도록 수정합니다.
하위 세트 지정
Amazon S3 Select
신규 고객은 더 이상 Amazon S3 Select를 사용할 수 없습니다. Amazon S3 Select 기존 고객은 평소처럼 이 기능을 계속 사용할 수 있습니다. 자세한 내용은 Amazon S3에서 데이터 쿼리를 최적화하는 방법을 참조하세요
객체 파일 이름에 대한 Amazon S3 SELECT
쿼리를 사용하여 데이터 객체의 하위 세트를 지정할 수 있습니다.
SQL 쿼리 SELECT
문이 정의되어 있습니다. 반환해야 할 데이터 객체를 지정하는 WHERE
절을 입력합니다.
Amazon S3 SELECT
설명에 대한 자세한 내용은 객체에서 콘텐츠 선택하기를 참조하세요.
하위 세트 생성을 선택한 후 이 하위 세트 사용을 선택하여 선택한 데이터를 사용합니다.
SageMaker 는 선택한 데이터 객체에 대한 매니페스트 파일을 생성합니다. 또한 새 매니페스트 파일을 가리키도록 입력 데이터 세트 위치 필드의 값을 업데이트합니다.