기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
CreateDatasetImportJob
데이터 소스(S3 버킷)에서 Personalize 데이터세트로 학습 데이터를 가져오는 작업을 생성합니다. Personalize에서 학습 데이터를 가져오도록 허용하려면 Personalize가 데이터 사본을 만들어 내부적으로 처리하므로 데이터 소스에서 읽을 수 있는 권한이 있는 IAM 서비스 역할을 지정해야 합니다. S3 버킷에 대한 액세스 권한의 부여에 대한 자세한 내용은 S3 리소스에 대한 액세스 권한 Personalize에 부여 단원을 참조하세요.
이미 추천자를 생성했거나 캠페인과 함께 사용자 지정 솔루션 버전을 배포한 경우 새 대량 레코드가 추천에 미치는 영향은 사용하는 도메인 사용 사례 또는 레시피에 따라 달라집니다. 자세한 내용은 새 데이터가 실시간 추천에 미치는 영향 단원을 참조하세요.
중요
기본 설정으로 데이터세트 가져오기 작업은 대량으로 가져온 데이터세트의 기존 데이터를 대체합니다. 기존 데이터를 바꾸지 않고 새 레코드를 추가하려면 CreateDatasetImportJob 작업의 가져오기 모드로 INCREMENTAL을 지정하십시오.
상태
데이터세트 가져오기 작업은 다음 상태 중 하나일 수 있습니다.
-
CREATE PENDING > CREATE IN_PROGRESS > ACTIVE 또는 CREATE FAILED
가져오기 작업의 상태를 확인하려면 데이터세트 가져오기 작업의 Amazon 리소스 이름 (ARN) 을 제공하여 DescribeDatasetImportJob호출하십시오. 상태가 ACTIVE로 표시되면 데이터세트 가져오기가 완료된 것이고, 상태가 CREATE FAILED로 표시되는 경우 응답에는 작업이 실패한 이유를 설명하는 failureReason
키가 포함됩니다.
참고
가져오기에는 시간이 필요합니다. 데이터세트를 사용하여 모델을 학습시키기 전에 상태가 ACTIVE로 나타날 때까지 기다려야 합니다.
구문 요청
{
"datasetArn": "string
",
"dataSource": {
"dataLocation": "string
"
},
"importMode": "string
",
"jobName": "string
",
"publishAttributionMetricsToS3": boolean
,
"roleArn": "string
",
"tags": [
{
"tagKey": "string
",
"tagValue": "string
"
}
]
}
요청 파라미터
요청은 JSON 형식으로 다음 데이터를 받습니다.
- datasetArn
-
가져온 데이터를 수신하는 데이터세트의 ARN입니다.
타입: 문자열
길이 제약: 최대 길이 256.
패턴:
arn:([a-z\d-]+):personalize:.*:.*:.+
필수 사항 여부: Yes
- dataSource
-
가져올 학습 데이터가 들어 있는 S3 버킷.
유형: DataSource객체
필수 여부: 예
- importMode
-
기존 데이터세트에 새 레코드를 추가하는 방법을 지정합니다. 기본 가져오기 모드는
FULL
입니다. 이전에 데이터세트로 대량 레코드를 가져온 적이 없는 경우FULL
만 지정할 수 있습니다.-
데이터세트의 기존 대량 데이터를 모두 덮어쓰려면
FULL
을 지정합니다. 개별적으로 가져온 데이터는 대체되지 않습니다. -
새 레코드를 데이터세트의 기존 데이터에 추가하려면
INCREMENTAL
을 지정합니다. Personalize는 동일한 ID를 가진 모든 레코드를 새 레코드로 대체합니다.
타입: 문자열
유효 값:
FULL | INCREMENTAL
필수 여부: 아니요
-
- jobName
-
데이터세트 가져오기 작업의 이름.
유형: 문자열
길이 제약: 최소 길이 1. 최대 길이 63.
패턴:
^[a-zA-Z0-9][a-zA-Z0-9\-_]*
필수 사항 여부: Yes
- publishAttributionMetricsToS3
-
지표 어트리뷰션을 생성한 경우 이 가져오기 작업에 대한 지표를 S3에 게시할지 여부를 지정합니다
타입: 부울
필수 항목 여부: 아니요
- roleArn
-
S3 데이터 소스에서 읽을 권한이 있는 IAM 역할의 ARN입니다.
타입: 문자열
길이 제약: 최대 길이 256.
패턴:
arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+
필수 사항 여부: Yes
-
데이터세트 가져오기 작업에 적용할 태그의 목록입니다.
유형: Tag객체 어레이
어레이 멤버: 최소 항목 수 0개. 최대 항목 수 200개.
필수 여부: 아니요
응답 구문
{
"datasetImportJobArn": "string"
}
응답 요소
작업이 성공하면 서비스가 HTTP 200 응답을 반송합니다.
다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.
- datasetImportJobArn
-
데이터세트 가져오기 작업의 ARN입니다.
타입: 문자열
길이 제약: 최대 길이 256.
패턴:
arn:([a-z\d-]+):personalize:.*:.*:.+
Errors
- InvalidInputException
-
필드 또는 파라미터에 유효한 값을 제공합니다.
HTTP 상태 코드: 400
- LimitExceededException
-
초당 요청 수 한도를 초과했습니다.
HTTP 상태 코드: 400
- ResourceAlreadyExistsException
-
지정된 리소스가 이미 있습니다.
HTTP 상태 코드: 400
- ResourceInUseException
-
지정된 리소스가 이미 사용 중입니다.
HTTP 상태 코드: 400
- ResourceNotFoundException
-
지정된 리소스를 찾을 수 없습니다.
HTTP 상태 코드: 400
- TooManyTagsException
-
이 리소스에 적용할 수 있는 최대 태그 수를 초과했습니다.
HTTP 상태 코드: 400
참고
언어별 AWS SDK 중 하나에서 이 API를 사용하는 방법에 대한 자세한 내용은 다음을 참조하십시오.