교육용 사용자 메타데이터 준비 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

교육용 사용자 메타데이터 준비

Amazon Personalize로 가져올 수 있는 사용자 데이터에는 사용자 연령과 같은 수치 데이터와 성별 또는 로열티 멤버십과 같은 범주별 메타데이터가 포함됩니다. 사용자에 대한 메타데이터를 Personalize 사용자 데이터세트로 가져옵니다.

도메인 사용 사례 또는 사용자 지정 레시피에 따라, 사용자 메타데이터는 Amazon Personalize가 사용자에게 더 관련성이 높은 항목을 추천하거나 더 의미 있는 사용자 세그먼트를 추천하는 데 도움이 될 수 있습니다. 또한 학습 후에는 상호 작용 데이터 없이도 모델이 사용자에게 항목을 추천하는 데 도움이 될 수 있습니다. 사용자 메타데이터를 사용하는 사용 사례 또는 레시피에 대한 자세한 내용은 에서 도메인 사용 사례 또는 레시피의 데이터 요구 사항을 참조하세요사용 사례를 Amazon Personalize 리소스에 매칭하기.

Amazon Personalize는 교육 시 사용자 이름, 사용자에 대한 키워드 또는 태그와 같은 비범주형 문자열 사용자 데이터를 사용하지 않습니다. 하지만 이 데이터를 가져오면 여전히 권장 사항을 개선할 수 있습니다. 자세한 내용은 비범주형 문자열 데이터 단원을 참조하십시오.

모든 도메인 사용 사례 및 사용자 지정 레시피의 경우 대량 사용자 데이터가 CSV 파일에 있어야 합니다. 파일의 각 행은 고유한 사용자를 나타내야 합니다. 데이터 준비를 마치면 스키마 JSON 파일을 만들 준비가 된 것입니다. 이 파일은 Amazon Personalize에 데이터 구조에 대해 알려줍니다. 자세한 내용은 Personalize 스키마에 대한 스키마 JSON 파일 생성 단원을 참조하십시오.

다음 섹션에서는 Amazon Personalize를 위한 사용자 데이터를 준비하는 방법에 대한 자세한 정보를 제공합니다. 모든 유형의 데이터에 대한 대량 데이터 형식 지침은 대량 데이터 형식 지침을 참조하십시오.

사용자 데이터 요구 사항

Amazon Personalize의 사용자 데이터 요구 사항은 다음과 같습니다. 사용 사례와 데이터에 따라 사용자 지정 열을 자유롭게 추가할 수 있습니다.

  • 데이터에는 각 사용자의 고유 식별자를 저장하는 USER _ID 열이 있어야 합니다. 모든 사용자는 사용자 ID를 가지고 있어야 합니다. stringa여야 하며 최대 길이는 256자여야 합니다.

  • 데이터에는 범주형 문자열 또는 숫자형 메타데이터 열이 하나 이상 있어야 합니다. 일부 사용자의 경우 사용자 메타데이터 열에 빈 값/null 값이 포함될 수 있습니다. 이러한 열은 최소 70% 이상 완료하는 것이 좋습니다.

  • 최대 메타데이터 열 수는 25개입니다.

데이터가 충분한지 확실하지 않거나 데이터 품질에 대해 질문이 있는 경우 데이터를 Amazon Personalize 데이터 세트로 가져와서 Amazon Personalize를 사용하여 분석할 수 있습니다. 자세한 내용은 Amazon Personalize 데이터세트의 데이터 품질 및 수량 분석 단원을 참조하십시오.

범주형 메타데이터

일부 레시피와 모든 도메인 사용 사례에서 Amazon Personalize는 사용자에게 가장 관련성이 높은 항목을 나타내는 기본 패턴을 식별할 때 사용자의 성별, 관심사 또는 멤버십 상태와 같은 범주형 메타데이터를 사용합니다. 사용 사례를 기반으로 자체 값 범위를 직접 정의합니다. 범주형 메타데이터는 어떤 언어로든 사용할 수 있습니다.

카테고리가 여러 개인 사용자의 경우 세로 막대 '|'로 각 값을 구분하십시오. 예를 들어 INTERESTS 필드의 경우 사용자에 대한 데이터가 다음과 같을 수 있습니다. Movies|TV Shows|Music

모든 레시피와 도메인으로 범주형 메타데이터를 가져와서 사용자의 속성에 따라 추천을 필터링하는 데 사용할 수 있습니다. 추천 필터링에 대한 자세한 내용은 추천 및 사용자 세그먼트 필터링단원을 참조하세요.

범주형 값은 최대 1000자까지 포함할 수 있습니다. 범주형 값이 1000자를 초과하는 사용자가 있는 경우, 데이터세트 가져오기 작업이 실패합니다.

비범주형 문자열 데이터

사용자를 제외하고 Amazon Personalize는 학습 시 사용자 IDs 이름, 사용자에 대한 키워드 또는 태그와 같은 비범주형 문자열 데이터를 사용하지 않습니다. 하지만 Amazon Personalize는 권장 사항을 필터링할 때 이를 사용할 수 있습니다. 추천을 받는 사용자 (the) 에 대한 비범주형 문자열 데이터를 기반으로 추천에서 항목을 포함하거나 추천에서 항목을 제거하는 필터를 생성할 수 있습니다. CurrentUser 필터에 대한 자세한 내용은 추천 및 사용자 세그먼트 필터링단원을 참조하세요. 비범주형 값은 최대 1000자까지 입력할 수 있습니다.

사용자 메타데이터 예제

CSV파일에 있는 사용자 메타데이터의 처음 몇 줄은 다음과 같을 수 있습니다.

USER_ID,AGE,GENDER,INTEREST 5,34,Male,hiking 6,56,Female,music 8,65,Male,movies|TV shows|music ... ...

USER_ID 열은 필수 항목이며 각 개별 사용자의 고유 식별자를 저장합니다. AGE열은 숫자 메타데이터입니다. GENDERINTEREST 열에는 각 사용자에 대한 범주형 메타데이터가 저장됩니다.

데이터 준비를 마치면 스키마 JSON 파일을 만들 준비가 된 것입니다. 이 파일은 Amazon Personalize에 데이터 구조에 대해 알려줍니다. 자세한 내용은 Personalize 스키마에 대한 스키마 JSON 파일 생성 단원을 참조하십시오. 위 샘플 데이터에 대한 스키마 JSON 파일은 다음과 같습니다.

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true }, { "name": "INTEREST", "type": "string", "categorical": true } ], "version": "1.0" }