쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

스키마 및 데이터세트 생성 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

스키마 및 데이터세트 생성

데이터세트 그룹을 생성한 후에는 가져올 각 데이터 유형에 대한 Amazon Personalize 스키마와 데이터세트를 생성할 준비가 되었습니다. 스키마는 Personalize에 데이터 구조를 알려주고 Personalize가 데이터를 파싱할 수 있도록 해 줍니다. Amazon Personalize에서 스키마를 생성할 때는 Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성에서 생성한 JSON 파일을 사용합니다.

데이터세트는 Amazon Personalize에서 데이터를 학습하기 위한 컨테이너입니다. 데이터세트 유형에 따라 요구 사항이 다릅니다. 가져오는 각 데이터 유형에 대한 데이터세트를 생성합니다. 다양한 유형의 데이터세트와 데이터 준비 방법에 대한 자세한 내용은 Amazon Personalize를 위한 학습 데이터 준비 섹션을 참조하세요.

Personalize 콘솔, AWS Command Line Interface (AWS CLI) 또는 AWS SDKs. 도메인 데이터세트 그룹에서는 작업 및 작업 상호 작용 데이터세트를 포함한 차선책 작업 리소스를 생성할 수 없습니다.

중요

스키마를 생성하고 나면 스키마를 변경할 수 없습니다. 그러나 새 열을 추가하는 경우 데이터세트의 스키마를 새 스키마로 바꿀 수 있습니다. 자세한 내용은 데이터세트의 스키마를 바꾸어 새 열 추가 단원을 참조하십시오.

데이터세트 및 스키마 생성(콘솔)

데이터 세트 그룹의 첫 번째 데이터 세트인 경우, 첫 번째 데이터 세트 유형은 항목 상호 작용 데이터 세트일 것입니다. 콘솔에서 항목 상호 작용 데이터 세트를 생성하려면 데이터 세트 이름을 지정한 다음 Avro 형식의 JSON 스키마를 지정합니다. 이 데이터세트 그룹의 첫 번째 데이터세트가 아닌 경우, 데이터세트 유형을 선택한 다음 이름과 스키마를 지정합니다.

Amazon Personalize 데이터세트 요구사항에 대한 자세한 내용은 Amazon Personalize를 위한 학습 데이터 준비 섹션을 참조하세요. Amazon Personalize 데이터세트 그룹 생성을 막 완료하고 이미 데이터 세트를 만드는 중이라면 이 절차의 4단계로 건너뛰세요.

데이터세트 및 스키마를 생성하려면
  1. 아직 생성하지 않았다면 Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성의 지침에 따라 데이터를 요약하는 스키마 JSON 파일을 생성합니다.

  2. https://console.aws.amazon.com/acm-pca/home에서 Personalize 콘솔을 열고 계정에 로그인합니다.

  3. 데이터세트 그룹 페이지의, Amazon Personalize 데이터세트 그룹 생성에서 데이터세트 그룹을 선택합니다.

  4. 1단계에서. 데이터세트 생성 및 데이터 가져오기를 선택하고 데이터세트 생성을 선택하고 생성할 데이터세트 유형을 선택합니다.

  5. Personalize 데이터세트로 직접 데이터 가져오기를 선택하고 다음을 선택합니다.

  6. 데이터세트 세부 정보에서 데이터세트 이름에 대해 데이터세트의 이름을 지정합니다.

  7. 데이터세트 스키마에서 새 스키마 생성 또는 기존 스키마 사용을 선택합니다.

  8. 기존 스키마를 사용하는 경우 사용할 기존 스키마를 선택합니다. 새 스키마를 생성할 경우 스키마에 이름을 제공하고 데이터와 일치하는 스키마 JSON을 붙여넣습니다. Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성에서 이 파일을 생성했습니다.

  9. 태그의 경우, 원하는 태그를 추가할 수 있습니다. Personalize 리소스 태그 지정에 대한 자세한 내용은 Personalize 리소스에 태그 지정단원을 참조하세요.

  10. 다음을 선택하고 Amazon Personalize 데이터세트로 학습 데이터 가져오기의 지침에 따라 데이터를 가져옵니다.

데이터세트 및 스키마 생성(AWS CLI)

를 사용하여 데이터 세트와 스키마를 생성하려면 create-schema 명령(CreateSchemaAPI 작업 사용)을 AWS CLI사용한 다음 create-dataset (CreateDatasetAPI 작업 사용)을 사용합니다.

스키마 및 데이터세트를 생성하려면
  1. 아직 생성하지 않았다면 Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성의 지침에 따라 데이터를 요약하는 스키마 JSON 파일을 생성합니다.

  2. 다음 명령을 실행하여 Personalize에서 스키마를 생성합니다. 스키마를 생성하고 나면 스키마를 변경할 수 없습니다. schemaName을 스키마의 이름으로 대체하고 file://SchemaName.json을 이전 단계에서 생성한 JSON 파일의 위치와 바꿉니다. 이 예제에서는 이 파일을 현재 폴더에 속한 것으로 표시합니다. 도메인 데이터 세트 그룹의 데이터 세트에 대한 스키마를 생성하는 경우 domain 파라미터를 추가하고 ECOMMERCE 또는 VIDEO_ON_DEMAND로 설정합니다. API에 대한 자세한 내용은 CreateSchema단원을 참조하세요.

    aws personalize create-schema \ --name SchemaName \ --schema file://SchemaName.json

    스키마의 리소스 이름(ARN)이 다음 예제와 같이 표시됩니다.

    { "schemaArn": "arn:aws:personalize:us-west-2:acct-id:schema/SchemaName" }
  3. 다음 명령을 실행하여 빈 데이터세트를 생성합니다. 데이터세트 그룹 생성(AWS CLI)에서 가져온 데이터세트 그룹 리소스 이름(ARN)과 이전 단계에서 가져온 스키마 ARN을 제공합니다. 데이터 세트 유형 값은 Interactions, Users, Items, Actions 또는 Action_Interactions일 수 있습니다. API에 대한 자세한 내용은 CreateDataset단원을 참조하세요.

    aws personalize create-dataset \ --name Dataset Name \ --dataset-group-arn Dataset Group ARN \ --dataset-type Dataset Type \ --schema-arn Schema Arn

    데이터세트 ARN은 다음 예제와 같이 표시됩니다.

    { "datasetArn": "arn:aws:personalize:us-west-2:acct-id:dataset/DatasetName/INTERACTIONS" }
  4. 추후 사용할 수 있도록 데이터세트 ARN을 기록합니다. 데이터 세트를 생성하고 나면 교육 데이터를 가져올 준비가 됩니다. Amazon Personalize 데이터세트로 학습 데이터 가져오기을 참조하세요.

데이터 세트 및 스키마(AWS SDKs) 생성

AWS SDKs를 사용하여 데이터 세트와 스키마를 생성하려면 먼저 Avro 형식으로 스키마를 정의하고 CreateSchema 작업을 사용하여 Personalize에 추가합니다. 스키마를 생성하고 나면 스키마를 변경할 수 없습니다. 그런 다음 CreateDataset작업을 사용하여 데이터세트를 생성합니다.

스키마 및 데이터세트를 생성하려면
  1. 아직 생성하지 않았다면 Amazon Personalize 스키마에 대한 스키마 JSON 파일 생성의 지침에 따라 데이터를 요약하는 스키마 JSON 파일을 생성합니다.

  2. 다음 코드를 사용하여 Amazon Personalize에서 스키마를 생성합니다. 스키마의 이름과 스키마 JSON 파일의 파일 경로를 지정합니다. 도메인 데이터 세트 그룹의 데이터 세트에 대한 스키마를 생성하는 경우 domain 파라미터를 추가하고 ECOMMERCE 또는 VIDEO_ON_DEMAND로 설정합니다. API에 대한 자세한 내용은 CreateSchema단원을 참조하세요.

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') with open('schemaFile.json') as f: createSchemaResponse = personalize.create_schema( name = 'schema name', schema = f.read() ) schema_arn = createSchemaResponse['schemaArn'] print('Schema ARN:' + schema_arn )
    SDK for Java 2.x
    public static String createSchema(PersonalizeClient personalizeClient, String schemaName, String filePath) { String schema = null; try { schema = new String(Files.readAllBytes(Paths.get(filePath))); } catch (IOException e) { System.out.println(e.getMessage()); } try { CreateSchemaRequest createSchemaRequest = CreateSchemaRequest.builder() .name(schemaName) .schema(schema) .build(); String schemaArn = personalizeClient.createSchema(createSchemaRequest).schemaArn(); System.out.println("Schema arn: " + schemaArn); return schemaArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateSchemaCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); import fs from "node:fs"; const schemaFilePath = "SCHEMA_PATH"; let mySchema = ""; try { mySchema = fs.readFileSync(schemaFilePath).toString(); } catch (err) { mySchema = "TEST"; // For unit tests. } // Set the schema parameters. export const createSchemaParam = { name: "NAME" /* required */, schema: mySchema /* required */, }; export const run = async () => { try { const response = await personalizeClient.send( new CreateSchemaCommand(createSchemaParam), ); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();
    import boto3 personalize = boto3.client('personalize') with open('schemaFile.json') as f: createSchemaResponse = personalize.create_schema( name = 'schema name', schema = f.read() ) schema_arn = createSchemaResponse['schemaArn'] print('Schema ARN:' + schema_arn )

    Personalize는 새 스키마의 ARN을 반환합니다. 이 정보는 다음 단계에서 사용해야 하므로 기록해 둡니다.

  3. CreateDataset 작업을 사용하여 데이터세트를 생성합니다. 다음 코드는 데이터세트를 생성하는 방법을 보여줍니다. 데이터 세트 그룹의 Amazon 리소스 이름(ARN)과 이전 단계의 스키마 ARN을 지정하고 데이터 세트 유형을 지정합니다. 데이터 세트 유형 값은 Interactions, Users, Items, Actions 또는 Action_Interactions일 수 있습니다. 데이터세트의 다양한 유형에 대한 자세한 내용은 Amazon Personalize를 위한 학습 데이터 준비단원을 참조하세요.

    SDK for Python (Boto3)
    import boto3 personalize = boto3.client('personalize') response = personalize.create_dataset( name = 'dataset_name', schemaArn = 'schema_arn', datasetGroupArn = 'dataset_group_arn', datasetType = 'dataset_type' ) print ('Dataset Arn: ' + response['datasetArn'])
    SDK for Java 2.x
    public static String createDataset(PersonalizeClient personalizeClient, String datasetName, String datasetGroupArn, String datasetType, String schemaArn) { try { CreateDatasetRequest request = CreateDatasetRequest.builder() .name(datasetName) .datasetGroupArn(datasetGroupArn) .datasetType(datasetType) .schemaArn(schemaArn).build(); String datasetArn = personalizeClient.createDataset(request).datasetArn(); System.out.println("Dataset " + datasetName + " created. Dataset ARN: " + datasetArn); return datasetArn; } catch(PersonalizeException e) { System.err.println(e.awsErrorDetails().errorMessage()); System.exit(1); } return ""; }
    SDK for JavaScript v3
    // Get service clients module and commands using ES6 syntax. import { CreateDatasetCommand } from "@aws-sdk/client-personalize"; import { personalizeClient } from "./libs/personalizeClients.js"; // Or, create the client here. // const personalizeClient = new PersonalizeClient({ region: "REGION"}); // Set the dataset's parameters. export const createDatasetParam = { datasetGroupArn: "DATASET_GROUP_ARN" /* required */, datasetType: "DATASET_TYPE" /* required */, name: "NAME" /* required */, schemaArn: "SCHEMA_ARN" /* required */, }; export const run = async () => { try { const response = await personalizeClient.send( new CreateDatasetCommand(createDatasetParam), ); console.log("Success", response); return response; // For unit tests. } catch (err) { console.log("Error", err); } }; run();
    import boto3 personalize = boto3.client('personalize') response = personalize.create_dataset( name = 'dataset_name', schemaArn = 'schema_arn', datasetGroupArn = 'dataset_group_arn', datasetType = 'dataset_type' ) print ('Dataset Arn: ' + response['datasetArn'])

    데이터 세트를 생성하고 나면 교육 데이터를 가져올 준비가 됩니다. Amazon Personalize 데이터세트로 학습 데이터 가져오기을(를) 참조하세요.

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.