기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
스키마 및 데이터세트 생성
데이터세트 그룹을 생성한 후에는 가져올 각 데이터 유형에 대한 Amazon Personalize 스키마와 데이터세트를 생성할 준비가 되었습니다. 스키마는 Personalize에 데이터 구조를 알려주고 Personalize가 데이터를 파싱할 수 있도록 해 줍니다. Amazon Personalize에서 스키마를 생성할 때는 Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성에서 생성한 JSON 파일을 사용합니다.
데이터세트는 Amazon Personalize에서 데이터를 학습하기 위한 컨테이너입니다. 데이터세트 유형에 따라 요구 사항이 다릅니다. 가져오는 각 데이터 유형에 대한 데이터세트를 생성합니다. 다양한 유형의 데이터세트와 데이터 준비 방법에 대한 자세한 내용은 Amazon Personalize를 위한 학습 데이터 준비 섹션을 참조하세요.
Personalize 콘솔, AWS Command Line Interface (AWS CLI) 또는 AWS SDKs. 도메인 데이터세트 그룹에서는 작업 및 작업 상호 작용 데이터세트를 포함한 차선책 작업 리소스를 생성할 수 없습니다.
중요
스키마를 생성하고 나면 스키마를 변경할 수 없습니다. 그러나 새 열을 추가하는 경우 데이터세트의 스키마를 새 스키마로 바꿀 수 있습니다. 자세한 내용은 데이터세트의 스키마를 바꾸어 새 열 추가 단원을 참조하십시오.
데이터세트 및 스키마 생성(콘솔)
데이터 세트 그룹의 첫 번째 데이터 세트인 경우, 첫 번째 데이터 세트 유형은 항목 상호 작용 데이터 세트일 것입니다. 콘솔에서 항목 상호 작용 데이터 세트를 생성하려면 데이터 세트 이름을 지정한 다음 Avro 형식
Amazon Personalize 데이터세트 요구사항에 대한 자세한 내용은 Amazon Personalize를 위한 학습 데이터 준비 섹션을 참조하세요. Amazon Personalize 데이터세트 그룹 생성을 막 완료하고 이미 데이터 세트를 만드는 중이라면 이 절차의 4단계로 건너뛰세요.
데이터세트 및 스키마를 생성하려면
-
아직 생성하지 않았다면 Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성의 지침에 따라 데이터를 요약하는 스키마 JSON 파일을 생성합니다.
-
https://console.aws.amazon.com/acm-pca/home
에서 Personalize 콘솔을 열고 계정에 로그인합니다. -
데이터세트 그룹 페이지의, Amazon Personalize 데이터세트 그룹 생성에서 데이터세트 그룹을 선택합니다.
-
1단계에서. 데이터세트 생성 및 데이터 가져오기를 선택하고 데이터세트 생성을 선택하고 생성할 데이터세트 유형을 선택합니다.
-
Personalize 데이터세트로 직접 데이터 가져오기를 선택하고 다음을 선택합니다.
-
데이터세트 세부 정보에서 데이터세트 이름에 대해 데이터세트의 이름을 지정합니다.
-
데이터세트 스키마에서 새 스키마 생성 또는 기존 스키마 사용을 선택합니다.
-
기존 스키마를 사용하는 경우 사용할 기존 스키마를 선택합니다. 새 스키마를 생성할 경우 스키마에 이름을 제공하고 데이터와 일치하는 스키마 JSON을 붙여넣습니다. Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성에서 이 파일을 생성했습니다.
-
태그의 경우, 원하는 태그를 추가할 수 있습니다. Personalize 리소스 태그 지정에 대한 자세한 내용은 Personalize 리소스에 태그 지정단원을 참조하세요.
-
다음을 선택하고 Amazon Personalize 데이터세트로 학습 데이터 가져오기의 지침에 따라 데이터를 가져옵니다.
데이터세트 및 스키마 생성(AWS CLI)
를 사용하여 데이터 세트와 스키마를 생성하려면 create-schema
명령(CreateSchemaAPI 작업 사용)을 AWS CLI사용한 다음 create-dataset
(CreateDatasetAPI 작업 사용)을 사용합니다.
스키마 및 데이터세트를 생성하려면
-
아직 생성하지 않았다면 Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성의 지침에 따라 데이터를 요약하는 스키마 JSON 파일을 생성합니다.
-
다음 명령을 실행하여 Personalize에서 스키마를 생성합니다. 스키마를 생성하고 나면 스키마를 변경할 수 없습니다.
schemaName
을 스키마의 이름으로 대체하고file://SchemaName.json
을 이전 단계에서 생성한 JSON 파일의 위치와 바꿉니다. 이 예제에서는 이 파일을 현재 폴더에 속한 것으로 표시합니다. 도메인 데이터 세트 그룹의 데이터 세트에 대한 스키마를 생성하는 경우domain
파라미터를 추가하고ECOMMERCE
또는VIDEO_ON_DEMAND
로 설정합니다. API에 대한 자세한 내용은 CreateSchema단원을 참조하세요.aws personalize create-schema \ --name
SchemaName
\ --schemafile://SchemaName.json
스키마의 리소스 이름(ARN)이 다음 예제와 같이 표시됩니다.
{ "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
-
다음 명령을 실행하여 빈 데이터세트를 생성합니다. 데이터세트 그룹 생성(AWS CLI)에서 가져온 데이터세트 그룹 리소스 이름(ARN)과 이전 단계에서 가져온 스키마 ARN을 제공합니다. 데이터 세트 유형 값은
Interactions
,Users
,Items
,Actions
또는Action_Interactions
일 수 있습니다. API에 대한 자세한 내용은 CreateDataset단원을 참조하세요.aws personalize create-dataset \ --name
Dataset Name
\ --dataset-group-arnDataset Group ARN
\ --dataset-typeDataset Type
\ --schema-arnSchema Arn
데이터세트 ARN은 다음 예제와 같이 표시됩니다.
{ "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
-
추후 사용할 수 있도록 데이터세트 ARN을 기록합니다. 데이터 세트를 생성하고 나면 교육 데이터를 가져올 준비가 됩니다. Amazon Personalize 데이터세트로 학습 데이터 가져오기을 참조하세요.
데이터 세트 및 스키마(AWS SDKs) 생성
AWS SDKs를 사용하여 데이터 세트와 스키마를 생성하려면 먼저 Avro 형식으로
스키마 및 데이터세트를 생성하려면
-
아직 생성하지 않았다면 Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성의 지침에 따라 데이터를 요약하는 스키마 JSON 파일을 생성합니다.
-
다음 코드를 사용하여 Amazon Personalize에서 스키마를 생성합니다. 스키마의 이름과 스키마 JSON 파일의 파일 경로를 지정합니다. 도메인 데이터 세트 그룹의 데이터 세트에 대한 스키마를 생성하는 경우
domain
파라미터를 추가하고ECOMMERCE
또는VIDEO_ON_DEMAND
로 설정합니다. API에 대한 자세한 내용은 CreateSchema단원을 참조하세요.import boto3 personalize = boto3.client('personalize') with open('
schemaFile.json
') as f: createSchemaResponse = personalize.create_schema( name = 'schema name
', schema = f.read() ) schema_arn = createSchemaResponse['schemaArn'] print('Schema ARN:' + schema_arn )Personalize는 새 스키마의 ARN을 반환합니다. 이 정보는 다음 단계에서 사용해야 하므로 기록해 둡니다.
-
CreateDataset 작업을 사용하여 데이터세트를 생성합니다. 다음 코드는 데이터세트를 생성하는 방법을 보여줍니다. 데이터 세트 그룹의 Amazon 리소스 이름(ARN)과 이전 단계의 스키마 ARN을 지정하고 데이터 세트 유형을 지정합니다. 데이터 세트 유형 값은
Interactions
,Users
,Items
,Actions
또는Action_Interactions
일 수 있습니다. 데이터세트의 다양한 유형에 대한 자세한 내용은 Amazon Personalize를 위한 학습 데이터 준비단원을 참조하세요.import boto3 personalize = boto3.client('personalize') response = personalize.create_dataset( name = '
dataset_name
', schemaArn = 'schema_arn
', datasetGroupArn = 'dataset_group_arn
', datasetType = 'dataset_type
' ) print ('Dataset Arn: ' + response['datasetArn'])데이터 세트를 생성하고 나면 교육 데이터를 가져올 준비가 됩니다. Amazon Personalize 데이터세트로 학습 데이터 가져오기을(를) 참조하세요.