CreateDatasetImportJob - Amazon Forecast

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

CreateDatasetImportJob

Amazon Forecast 데이터 세트로 훈련 데이터를 가져옵니다. Amazon Simple Storage Service(S3) 버킷의 훈련 데이터 위치와 데이터를 가져올 데이터 세트의 Amazon 리소스 이름(ARN)을 제공합니다.

Amazon Forecast는 데이터의 사본을 만들어 내부 AWS 시스템에서 처리하므로 Amazon Forecast가 데이터에 액세스하기 위해 맡을 수 있는 AWS Identity and Access Management (IAM) 역할을 포함하는 DataSource객체를 지정해야 합니다. 자세한 내용은 권한 설정을 참조하세요.

훈련 데이터는 CSV 또는 Parquet 형식이어야 합니다. 구분자는 쉼표(,)여야 합니다.

예를 들어 특정 파일, S3 버킷 또는 S3 버킷 내 폴더로 경로를 지정할 수 있습니다. 뒤의 두 가지 경우, Amazon Forecast는 최대 10,000개 파일 한도까지 모든 파일을 가져옵니다.

데이터 세트 가져오기는 집계되지 않으므로 예측기를 훈련하거나 예측을 생성할 때 가장 최근 데이터 세트 가져오기가 사용됩니다. 가장 최근 데이터 세트 가져오기에 이전 가져오기 이후 수집된 새 데이터뿐만 아니라 모델링하려는 모든 데이터가 포함되어 있는지 확인합니다.

지정된 기준으로 필터링된 모든 데이터세트 가져오기 작업의 목록을 가져오려면 작업을 사용하십시오. ListDatasetImportJobs

구문 요청

{ "DatasetArn": "string", "DatasetImportJobName": "string", "DataSource": { "S3Config": { "KMSKeyArn": "string", "Path": "string", "RoleArn": "string" } }, "Format": "string", "GeolocationFormat": "string", "ImportMode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "TimestampFormat": "string", "TimeZone": "string", "UseGeolocationForTimeZone": boolean }

요청 파라미터

요청은 JSON 형식으로 다음 데이터를 받습니다.

DatasetArn

데이터를 가져올 Amazon Forecast 데이터 세트의 Amazon 리소스 이름(ARN)입니다.

타입: 문자열

길이 제약: 최대 길이 256.

패턴: arn:([a-z\d-]+):forecast:.*:.*:.+

필수 사항 여부: Yes

DatasetImportJobName

데이터세트 가져오기 작업의 이름. 이름에 현재 타임스탬프를 포함하는 것이 좋습니다(예: 20190721DatasetImport). 이렇게 하면 ResourceAlreadyExistsException 예외가 발생하지 않도록 할 수 있습니다.

유형: 문자열

길이 제약: 최소 길이 1. 최대 길이 63.

패턴: ^[a-zA-Z][a-zA-Z0-9_]*

필수 사항 여부: Yes

DataSource

가져올 교육 데이터의 위치 및 데이터에 액세스하기 위해 Amazon Forecast가 맡을 수 있는 AWS Identity and Access Management (IAM) 역할. 훈련 데이터는 Amazon S3 버킷에 저장해야 합니다.

암호화를 사용하는 경우 AWS Key Management Service (KMS) 키를 DataSource 포함해야 하며 IAM 역할은 Amazon Forecast에서 키에 액세스할 수 있는 권한을 허용해야 합니다. KMS 키와 IAM 역할은 작업 EncryptionConfig 파라미터에 지정된 것과 일치해야 합니다. CreateDataset

유형: DataSource객체

필수 여부: 예

Format

가져온 데이터의 형식, CSV 또는 PARQUET. 기본값은 CSV입니다.

타입: 문자열

길이 제약 조건: 최대 길이는 7입니다.

패턴: ^CSV|PARQUET$

Required: No

GeolocationFormat

지리적 위치 속성의 형식입니다. 다음 두 가지 방법 중 하나로 지리적 위치 속성의 형식을 지정할 수 있습니다.

  • LAT_LONG - 10진수 형식의 위도 및 경도(예: 47.61_-122.33).

  • CC_POSTALCODE(미국만 해당) - 국가 코드(US)와 5자리 우편번호가 차례로 표시됩니다(예: US_98121).

타입: 문자열

길이 제약: 최대 길이 256.

패턴: ^[a-zA-Z0-9_]+$

Required: No

ImportMode

데이터 세트 가져오기 작업이 FULL 가져오기인지 INCREMENTAL 가져오기인지 지정합니다. FULL 데이터 세트 가져오기는 기존 데이터를 모두 새로 가져온 데이터로 대체합니다. INCREMENTAL 가져오기는 가져온 데이터를 기존 데이터에 추가합니다.

타입: 문자열

유효 값: FULL | INCREMENTAL

필수 여부: 아니요

Tags

데이터 세트 가져오기 작업을 분류하고 구성하는 데 도움이 되도록 데이터 세트 가져오기 작업에 적용하는 선택적 메타데이터입니다. 각 태그는 사용자가 정의하는 키와 선택적 값으로 구성됩니다.

태그에 적용되는 기본 제한은 다음과 같습니다.

  • 리소스당 최대 태그 수 - 50개.

  • 각 리소스에 대해 각 태그 키는 고유하며 하나의 값만 가질 수 있습니다.

  • 최대 키 길이 - 유니코드 문자 128자(UTF-8).

  • 최대 값 길이 - 유니코드 문자 256자(UTF-8).

  • 태깅 스키마를 여러 서비스와 리소스에서 사용하는 경우 다른 서비스 또한 허용되는 문자에 대한 제한이 있을 수 있음을 유의합니다. 일반적으로 허용되는 문자는 UTF-8로 표현할 수 있는 문자, 숫자 및 공백과 특수 문자 + - = . _ : / @.

  • 태그 키와 값은 대소문자를 구분합니다.

  • 키 접두사와 같은 대문자 또는 소문자 조합은 사용하도록 예약되어 있으므로 사용하지 aws: 마십시오. AWS: AWS 이 접두사가 있는 태그 키는 편집하거나 삭제할 수 없습니다. 값에 이 접두사가 포함될 수 있습니다. 태그 값에는 접두사로 aws가 있지만 키에는 없는 경우 Forecast는 해당 태그를 사용자 태그로 간주하여 50개 태그 한도에 포함합니다. aws 키 접두사만 있는 태그는 리소스당 태그 수 한도에 포함되지 않습니다.

유형: Tag객체 어레이

어레이 멤버: 최소 항목 수 0개. 최대 항목 수 200개.

필수 여부: 아니요

TimestampFormat

데이터 세트의 타임스탬프 형식입니다. 지정하는 형식은 데이터 세트가 생성될 때 지정한 DataFrequency에 따라 달라집니다. 지원되는 형식은 다음과 같습니다.

  • "yyyy-MM-dd"

    다음 데이터 빈도의 경우: Y, M, W, D

  • "yyyy-MM-dd HH:mm:ss"

    다음 데이터 빈도의 경우: H, 30분, 15분, 1분 및 선택적으로 Y, M, W, D

형식이 지정되지 않은 경우 Amazon Forecast는 형식이 “yyyy-MM-dd HH:mm:ss”일 것으로 예상합니다.

타입: 문자열

길이 제약: 최대 길이 256.

패턴: ^[a-zA-Z0-9\-\:\.\,\'\s]+$

Required: No

TimeZone

데이터 세트의 모든 항목의 단일 시간대. 이 옵션은 모든 타임스탬프가 단일 시간대 내에 있는 데이터 세트 또는 모든 타임스탬프가 단일 시간대로 정규화된 경우에 적합합니다.

유효한 시간대 이름의 전체 목록은 Joda-Time API를 참조하세요.

타입: 문자열

길이 제약: 최대 길이 256.

패턴: ^[a-zA-Z0-9\/\+\-\_]+$

Required: No

UseGeolocationForTimeZone

지리적 위치 속성에서 시간대 정보를 자동으로 추출합니다. 이 옵션은 여러 시간대의 타임스탬프가 포함되어 있고 이러한 타임스탬프가 현지 시간으로 표시되는 데이터 세트에 적합합니다.

타입: 부울

필수 여부: 아니요

응답 구문

{ "DatasetImportJobArn": "string" }

응답 요소

작업이 성공하면 서비스가 HTTP 200 응답을 반송합니다.

다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.

DatasetImportJobArn

데이터 세트 가져오기 작업의 Amazon 리소스 이름(ARN)입니다.

타입: 문자열

길이 제약: 최대 길이 256.

패턴: arn:([a-z\d-]+):forecast:.*:.*:.+

Errors

InvalidInputException

요청에 잘못된 값이나 유효한 범위를 초과하는 값이 포함되어 있기 때문에 요청을 처리할 수 없습니다.

HTTP 상태 코드: 400

LimitExceededException

계정당 리소스 수 제한을 초과했습니다.

HTTP 상태 코드: 400

ResourceAlreadyExistsException

이 이름을 가진 리소스가 이미 있습니다. 다른 이름으로 다시 시도하세요.

HTTP 상태 코드: 400

ResourceInUseException

지정된 리소스가 이미 사용 중입니다.

HTTP 상태 코드: 400

ResourceNotFoundException

해당 Amazon 리소스 이름(ARN)으로 리소스를 찾을 수 없습니다. ARN을 확인하고 다시 시도하세요.

HTTP 상태 코드: 400

참고

언어별 AWS SDK 중 하나에서 이 API를 사용하는 방법에 대한 자세한 내용은 다음을 참조하십시오.