사용자 데이터 세트 스키마 요구 사항(사용자 지정) - Personalize

사용자 데이터 세트 스키마 요구 사항(사용자 지정)

사용자 데이터세트는 사용자에 대한 메타데이터를 저장합니다. 여기에는 각 항목에 대한 연령, 성별, 로열티 멤버십과 같은 정보가 포함될 수 있습니다. Personalize로 가져올 수 있는 사용자 데이터 유형에 대한 자세한 내용은 사용자 메타데이터단원을 참조하세요.

각 사용자에 제공하는 데이터는 스키마와 일치해야 합니다. 최소한 각 사용자의 사용자 ID(최대 길이 256자)를 제공해야 합니다. 스키마에 따라 사용자 메타데이터에는 비어 있음/null 값이 포함될 수 있습니다. 사용자 스키마에는 최소 하나 이상의 메타데이터 필드가 있어야 하지만 null유형을 추가할 경우 사용자에 대해 이 값이 null이 될 수 있습니다. 사용 사례와 데이터에 따라 추가 필드를 마음대로 추가할 수 있습니다. 필드가 필수 또는 예약으로 나열되어 있지 않고 데이터 유형이 스키마 데이터 유형에 나열된 경우, 필드 이름과 데이터 사용자가 선택할 수 있습니다.

범주형 데이터를 사용하려면 스키마에서 유형 string필드를 추가하고 필드의 범주형 속성을 true로 설정합니다. 그런 다음 대량 CSV 파일 및 개별 항목 가져오기에 범주형 데이터를 포함합니다. 여러 범주를 갖는 개인 사용자의 경우, 세로 막대 '|'를 사용하여 각 값을 구분합니다. 예를 들어, SUBSCRIPTION_MODEL 필드의 경우 사용자에 대한 데이터는 학생|월별|할인이 될 수 있습니다.

범주형 값은 최대 1000자까지 포함할 수 있습니다. 범주형 값이 1000자를 초과하는 사용자가 있는 경우, 데이터세트 가져오기 작업이 실패합니다.

사용자 데이터세트에 대한 최소 요구 사항 및 최대 데이터 한도에 대한 자세한 내용은 Service quotas단원을 참조하세요.

사용자 스키마 예제(사용자 지정)

다음 예제에서는 사용자 스키마를 조직하는 방법을 보여줍니다. USER_ID 필드는 필수 필드이고 AGEGENDER필드는 메타데이터입니다. 하나 이상의 메타데이터 필드가 필요하며 최대 25개의 메타데이터 필드를 추가할 수 있습니다. 스키마 요구 사항에 대한 자세한 내용은 사용자 지정 데이터세트 및 스키마 요구 사항단원을 참조하세요.

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true } ], "version": "1.0" }

이 스키마의 경우, CSV 파일의 이력 데이터의 처음 몇 줄은 다음과 같을 수 있습니다.

USER_ID,AGE,GENDER 5,34,Male 6,56,Female 8,65,Male ... ...