기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon SageMaker AI Ground Truth 형식 매니페스트 파일을 사용하여 데이터 세트를 생성할 수 있습니다. Amazon SageMaker AI Ground Truth 작업에서 매니페스트 파일을 사용할 수 있습니다. 이미지와 레이블이 SageMaker AI Ground Truth 매니페스트 파일 형식이 아닌 경우 SageMaker AI 형식 매니페스트 파일을 생성하고 이를 사용하여 레이블이 지정된 이미지를 가져올 수 있습니다.
새 데이터세트를 생성할 때 선택적으로 태그를 지정할 수 있도록 CreateDataset
작업이 업데이트되었습니다. 태그는 리소스를 분류하고 관리하는 데 도움이 될 수 있는 키-값 페어입니다.
주제
SageMaker AI Ground Truth 매니페스트 파일을 사용하여 데이터 세트 생성(콘솔)
다음 절차에서는 SageMaker AI Ground Truth 형식 매니페스트 파일을 사용하여 데이터 세트를 생성하는 방법을 보여줍니다.
-
다음 중 하나를 수행하여 훈련 데이터 세트의 매니페스트 파일을 생성합니다.
-
의 지침에 따라 SageMaker AI GroundTruth 작업으로 매니페스트 파일을 생성합니다 Amazon SageMaker AI Ground Truth 작업을 사용하여 이미지 레이블 지정.
-
매니페스트 파일 생성의 지침에 따라 사용자 고유의 매니페스트 파일을 생성하세요.
테스트 데이터 세트를 만들려면 1단계를 반복하여 테스트 데이터 세트를 만드세요.
-
에서 Amazon Rekognition 콘솔을 엽니다https://console.aws.amazon.com/rekognition/
. -
사용자 지정 레이블 사용을 선택합니다.
-
Get started를 선택합니다.
-
왼쪽 탐색 창에서 프로젝트를 선택합니다.
-
프로젝트 페이지에서 데이터 세트에 추가하려는 프로젝트를 선택합니다. 프로젝트 세부 정보 페이지가 열립니다.
-
데이터 세트 생성을 선택합니다. 데이터 세트 생성 페이지가 표시됩니다.
-
시작 구성에서 단일 데이터 세트로 시작 또는 훈련 데이터 세트로 시작을 선택합니다. 더 높은 품질의 모델을 만들려면 별도의 훈련 및 테스트 데이터 세트로 시작하는 것이 좋습니다.
-
훈련 데이터 세트 세부 정보 섹션에서 Ground Truth로 SageMaker 레이블이 지정된 이미지 가져오기를 선택합니다.
-
매니페스트 파일 위치에 1단계에서 생성한 매니페스트 파일의 위치를 입력하세요.
-
데이터 세트 생성을 선택합니다. 프로젝트의 데이터 세트 페이지가 열립니다.
-
레이블을 추가하거나 변경해야 하면 이미지 레이블 지정 항목을 수행합니다.
-
모델 훈련(콘솔)에 나온 단계에 따라 모델을 훈련하세요.
SageMaker AI Ground Truth 매니페스트 파일을 사용하여 데이터 세트 생성(SDK)
다음 절차에서는 CreateDataset를 사용하여 매니페스트 파일에서 훈련 또는 테스트 데이터 세트를 생성하는 방법을 보여줍니다API.
SageMaker AI Ground Truth 작업의 출력과 같은 기존 매니페스트 파일을 사용하거나 자체 매니페스트 파일을 생성할 수 있습니다.
-
아직 설치하지 않은 경우 및를 설치하고 구성합니다 AWS CLI AWS SDKs. 자세한 내용은 4단계: AWS CLI 및 설정 AWS SDKs 단원을 참조하십시오.
-
다음 중 하나를 수행하여 훈련 데이터 세트의 매니페스트 파일을 생성합니다.
-
의 지침에 따라 SageMaker AI GroundTruth 작업으로 매니페스트 파일을 생성합니다 Amazon SageMaker AI Ground Truth 작업을 사용하여 이미지 레이블 지정.
-
매니페스트 파일 생성의 지침에 따라 사용자 고유의 매니페스트 파일을 생성하세요.
테스트 데이터 세트를 만들려면 2단계를 반복하여 테스트 데이터 세트를 만드세요.
-
-
다음 예제 코드를 사용하여 훈련 및 테스트 데이터 세트를 만드세요.
다음 코드를 사용하여 데이터 세트를 생성하세요. 다음을 바꿉니다.
-
project_arn
- 테스트 데이터 세트를 추가하려는 ARN 프로젝트의 입니다. -
type
- 생성하려는 데이터 세트 유형(TRAIN 또는 TEST) -
bucket
: 데이터 세트의 매니페스트 파일이 들어 있는 버킷 -
manifest_file
: 매니페스트의 경로 및 파일 이름
aws rekognition create-dataset --project-arn
project_arn
\ --dataset-typetype
\ --dataset-source '{ "GroundTruthManifest": { "S3Object": { "Bucket": "bucket
", "Name": "manifest_file
" } } }' \ --profile custom-labels-access --tags '{"key1": "value1", "key2": "value2"}' -
레이블을 추가하거나 변경해야 하면 레이블 관리(SDK) 항목을 참조하세요.
-
모델 훈련(SDK)에 나온 단계에 따라 모델을 훈련하세요.
데이터세트 생성 요청
다음은 CreateDataset 작업 요청의 포름입니다.
{
"DatasetSource": {
"DatasetArn": "string",
"GroundTruthManifest": {
"S3Object": {
"Bucket": "string",
"Name": "string",
"Version": "string"
}
}
},
"DatasetType": "string",
"ProjectArn": "string",
"Tags": {
"string": "string"
}
}