Personalize 스키마에 대한 스키마 JSON 파일 생성 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Personalize 스키마에 대한 스키마 JSON 파일 생성

데이터를 준비한 후에는 가져오는 각 데이터 유형에 대한 스키마 JSON 파일을 생성할 준비가 되었습니다. 이러한 파일은 열 이름 및 데이터 유형을 포함하여 데이터의 구조와 내용을 간략하게 설명합니다.

에서 Amazon Personalize 스키마를 생성할 때 스키마 JSON 파일을 사용합니다스키마 및 데이터세트 생성. Personalize에서 스키마는 데이터 세트로 가져올 때 Personalize가 데이터를 구문 분석할 수 있도록 허용하는 리소스입니다. 사용 중인 각 데이터 세트에 대해 스키마를 생성합니다.

사용자 지정 리소스의 경우 각 데이터 세트에는 특정 스키마 요구 사항이 있습니다. 도메인 데이터 세트 그룹의 경우 선택한 도메인에 따라 데이터 세트 및 스키마 요구 사항이 결정됩니다. 각 도메인에는 각 데이터세트 유형에 대한 기본 스키마가 있습니다. 데이터 세트를 생성할 때 기존 도메인 스키마를 사용하거나 기존 기본 스키마를 수정하여 새 도메인을 생성할 수 있습니다. 기본 스키마를 도메인에 가져올 데이터에 대한 설명서로 사용하세요.

다음 섹션에서는 각 데이터 세트 유형에 대한 스키마 JSON 파일을 생성하기 위한 사용자 지정 및 도메인 요구 사항을 제공합니다.

스키마 서식 지적 요구 사항

도메인 데이터 세트 그룹 또는 사용자 지정 데이터 세트 그룹의 데이터 세트에 대한 스키마를 생성할 때는 다음 지침을 따라야 합니다.

  • Avro 형식으로 스키마를 정의해야 합니다. 지원되는 Avro 데이터 유형에 대한 자세한 내용은 스키마 데이터 유형을 참조하세요.

  • 스키마에는 값이 데이터세트 유형과 일치해야 하는 이름 키가 있습니다.

  • 스키마 필드는 순서에 관계없이 표시될 수 있지만 CSV 파일의 해당 열 헤더 순서와 일치해야 합니다.

  • 스키마는 중첩 구조가 없는 플랫 JSON 파일이어야 합니다. 예를 들어, 특정 필드는 여러 하위 필드의 부모 필드가 될 수 없습니다.

  • Personalize 스키마는 배열 및 맵과 같은 복잡한 유형을 지원하지 않습니다.

  • 스키마 필드는 고유한 영숫자 이름을 가져야 합니다. 예를 들어, GENRES_FIELD_1필드와 GENRESFIELD1필드를 모두 추가할 수는 없습니다.

  • 필수 필드를 필수 데이터 유형으로 정의해야 합니다. 예약된 범주형 문자열 필드는 categorical속성을 true로 설정해야만 하며, 예약된 문자열 필드는 범주형일 수 없습니다. 키워드는 데이터에 포함될 수 없습니다.

  • 고유 메타데이터 유형 string 필드를 추가하고 교육 시 Amazon Personalize에서 사용하도록 하려면 categorical 속성 또는 textual 속성(항목 스키마는 텍스트 속성이 있는 필드만 지원)을 포함해야 합니다.

  • Personalize는 추천을 교육하거나 필터링할 때 boolean유형 데이터를 사용하지 않습니다. Personalize가 교육 또는 필터링 시 부울 데이터를 사용하도록 하려면, 문자열 유형의 필드를 사용하고 데이터에 값 "True""False"를 사용합니다. 또는 int 또는 long 유형과 값 01를 사용할 수 있습니다.

  • 텍스트 필드는 해당 유형 string이어야 하며 textual속성이 true로 설정되어 있어야 합니다. 비정형 텍스트 데이터에 대한 자세한 내용은 비정형 텍스트 메타데이터단원을 참조하세요.

도메인 데이터세트 그룹 데이터세트에는 도메인과 데이터세트 유형에 따른 추가 요구 사항이 있습니다. 사용자 지정 데이터세트 그룹 데이터세트에는 유형에 따라 추가 요구 사항이 있습니다.

스키마 데이터 유형

Personalize 스키마는 필드에 대해 다음과 같은 Avro 유형을 지원합니다.

  • float

  • double

  • int

  • long

  • 문자열

  • boolean

  • null

일부 필수 및 예약 필드는 null 데이터를 지원합니다. 필드에 null유형을 추가하면 불완전한 데이터(예: 값이 비어 있는 메타데이터)를 사용하여 추천을 생성할 수 있습니다. null 데이터를 지원하는 필드에 대한 자세한 내용은 도메인의 스키마 요구 사항 주제인 VIDEO_ON_ DEMAND 데이터세트 및 스키마, 또는 ECOMMERCE데이터세트 및 스키마를 참조하세요사용자 지정 데이터세트 및 스키마. 다음 예제에서는 GENDER 필드에 null 유형을 추가하는 방법을 보여줍니다.

{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }