학습을 위한 액션 메타데이터 준비 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

학습을 위한 액션 메타데이터 준비

작업은 사용자에게 추천하고 싶은 참여 또는 수익 창출 활동입니다. 작업에는 모바일 앱 설치, 멤버십 프로필 작성, 로열티 프로그램 가입, 프로모션 이메일 구독 등이 포함될 수 있습니다. 작업에 대한 데이터를 Amazon Personalize 작업 데이터 세트로 가져옵니다. 작업 데이터의 예로는 작업의 고유 ID, 작업의 예상 값, 작업의 만료 타임스탬프 등이 있습니다.

Next-Best-Action을 사용하는 경우 작업 메타데이터를 가져와야 합니다. Amazon Personalize는 이 레시피를 사용하여 Actions 데이터세트로 가져온 액션으로부터 차선책을 예측합니다. 액션 메타데이터를 사용하는 다른 레시피나 사용 사례는 없습니다. 도메인 데이터세트 그룹에는 Actions 데이터세트를 생성할 수 없습니다.

Amazon Personalize는 교육 시 작업 제목 또는 태그와 같은 비범주형 문자열 작업 데이터를 사용하지 않습니다. 하지만 이 데이터를 가져오면 권장 사항이 여전히 향상될 수 있습니다. 자세한 내용은 비범주형 문자열 데이터 단원을 참조하십시오.

대량 작업 데이터는 CSV 파일에 있어야 합니다. 파일의 각 행은 고유한 작업을 나타내야 합니다. 데이터 준비를 마치면 스키마 JSON 파일을 만들 준비가 된 것입니다. 이 파일은 Amazon Personalize에 데이터 구조에 대해 알려줍니다. 자세한 내용은 Personalize 스키마에 대한 스키마 JSON 파일 생성 단원을 참조하십시오.

다음 섹션에서는 Amazon Personalize용 작업 메타데이터를 준비하는 방법에 대한 자세한 정보를 제공합니다. 모든 유형의 데이터에 대한 대량 데이터 형식 지침은 대량 데이터 형식 지침을 참조하십시오.

조치 데이터 요구 사항

다음은 Amazon Personalize의 작업 데이터 요구 사항입니다.

  • 각 작업의 고유 식별자를 저장하는 ACTION _ID 열이 있어야 합니다. 모든 작업에는 항목 ID가 있어야 합니다. stringa여야 하며 최대 길이는 256자여야 합니다.

  • 데이터에는 범주형 문자열 또는 숫자형 메타데이터 열이 하나 이상 있어야 합니다. 액션 메타데이터 열에는 빈 값/Null 값이 포함될 수 있습니다. 이러한 열은 최소 70% 이상 완료하는 것이 좋습니다.

  • 모델 교육 중에 Amazon Personalize는 최대 1,000개의 작업을 고려합니다. 작업을 1,000개가 넘게 가져올 경우 Amazon Personalize는 새 작업(상호 작용 없이 최근에 추가한 작업)과 최근 상호 작용 데이터가 있는 기존 작업에 우선순위를 두고 교육에 포함할 작업을 결정합니다.

  • 최대 열 수는 10개입니다.

작업 만료 타임스탬프 데이터

작업 만료 타임스탬프는 작업이 더 이상 유효하지 않은 날짜를 지정합니다. 작업 만료 타임스탬프 데이터를 Unix epoch 시간 형식(초)으로 제공합니다. 작업이 만료된 경우 Amazon Personalize는 해당 작업을 추천에 포함하지 않습니다.

추천을 특정 시간 프레임에만 표시하도록 제한하려면 작업에 대해 작업 만료 타임스탬프를 지정하세요. 예를 들어, 특정 달까지 멤버십 모집을 실행하는 애플리케이션이 있을 수 있습니다. 등록 작업의 만료 타임스탬프를 해당 월말로 설정할 수 있습니다. Amazon Personalize는 해당 날짜에 다다르면 이 작업 추천을 자동으로 중단합니다.

새 작업에 대한 만료 타임스탬프를 과거 시간으로 설정하거나 작업 타임스탬프를 과거 시간으로 업데이트하면 추천에서 작업이 제거되는 데 최대 2시간이 걸릴 수 있습니다.

반복 빈도 데이터

반복 빈도 데이터는 작업 상호 작용 데이터 세트의 사용자 기록을 기반으로 사용자가 상호 작용한 후 Amazon Personalize가 특정 작업을 추천할 때까지 기다려야 하는 기간을 지정합니다. 작업의 반복 빈도를 일 단위로 지정합니다(최대 30일).

예를 들어, 각 사용자가 계정과 프로필을 생성하는 전자 상거래 애플리케이션이 있을 수 있습니다. complete profile 작업이 있는데 사용자가 상호 작용한 후 일주일을 기다렸다가 다시 추천하려는 경우 작업의 REPEAT_FREQENCY를 7일로 지정합니다. 7일 후, Amazon Personalize는 추천에 해당 작업을 고려하기 시작합니다.

작업의 반복 빈도를 제공하지 않으면 Amazon Personalize는 추천에 해당 작업이 나타나는 횟수에 제한을 두지 않습니다.

값 데이터

값 데이터는 각 작업의 비즈니스 가치 또는 중요도입니다. 작업의 value는 1~10이 될 수 있으며, 여기서 10이 데이터 세트에서 가장 중요한 작업입니다.

예를 들어, 기본 구독에 등록하기 위한 작업과 프리미엄 서비스에 등록하기 위한 작업이라는 2개의 작업이 있을 수 있습니다. 기본 서비스의 경우 5 값을 지정하고, 프리미엄의 경우 값을 10으로 지정할 수 있습니다.

Amazon Personalize는 사용자에게 추천할 최선의 작업을 결정할 때 값 데이터를 하나의 입력으로 사용합니다. 예를 들어, 사용자가 한 작업 또는 다른 작업을 수행할 확률이 동일한 경우 Amazon Personalize는 추천에서 가장 높은 값을 지닌 작업을 보다 가치 있게 평가합니다.

생성 타임스탬프 데이터

Amazon Personalize는 생성 타임스탬프 데이터(Unix epoch 시간 형식, 초 단위)를 사용하여 작업의 수명을 계산하고 그에 따라 추천을 조정합니다.

생성 타임스탬프 데이터가 없는 경우 Amazon Personalize는 모든 작업 상호 작용 데이터에서 이 정보를 유추합니다. 작업에서 가장 오래된 상호 작용 데이터의 타임스탬프를 작업 생성 타임스탬프로 사용합니다. 작업에 상호 작용 데이터가 없는 경우, 생성 타임스탬프는 교육 세트에 있는 최신 상호 작용의 타임스탬프로 설정되며 Amazon Personalize는 이를 새 작업으로 간주합니다.

범주형 메타데이터

Amazon Personalize는 사용자에게 가장 적합한 작업을 나타내는 기본 패턴을 식별할 때 계절성, 작업 독점성 등 작업에 대한 범주형 메타데이터를 사용합니다. 사용 사례를 기반으로 자체 값 범위를 직접 정의합니다. 범주형 메타데이터는 어떤 언어로든 사용할 수 있습니다.

범주형 데이터를 가져와서 작업 속성에 따라 추천을 필터링하는 데 사용할 수 있습니다. 추천 필터링에 대한 자세한 내용은 추천 및 사용자 세그먼트 필터링단원을 참조하세요.

범주형 값은 최대 1000자까지 입력할 수 있습니다. 범주형 값이 1,000자를 초과하는 작업이 있는 경우 데이터 세트 가져오기 작업이 실패합니다.

비범주형 문자열 데이터

작업을 IDs 제외하고 Amazon Personalize는 학습 시 작업 이름, 작업에 대한 키워드 또는 태그와 같은 비범주형 문자열 데이터를 사용하지 않습니다. 하지만 Amazon Personalize는 권장 사항을 필터링할 때 이를 사용할 수 있습니다. 필터를 생성하여 비범주형 문자열 데이터를 기반으로 추천에서 작업을 포함하거나 추천에서 제거할 수 있습니다. 필터에 대한 자세한 내용은 추천 및 사용자 세그먼트 필터링단원을 참조하세요. 비범주형 값은 최대 1000자까지 입력할 수 있습니다.

액션 메타데이터 예제

CSV파일에 있는 작업 메타데이터의 처음 몇 줄은 다음과 같을 수 있습니다.

ACTION_ID,VALUE,MEMBERSHIP_LEVEL,CREATION_TIMESTAMP,REPEAT_FREQUENCY 1,10,Deluxe|Premium,1510003267,7 2,5,Basic,1580003267,7 3,5,Preview,1590003267,3 4,10,Deluxe|Platinum,1560003267,4 ... ...

ACTION_ID 열은 필수 항목입니다. MEMBERSHIP_LEVEL열은 범주형 문자열 필드입니다. VALUE, CREATION_TIMESTAMP, REPEAT_FREQUENCY 필드는 필수 유형이 포함된 예약된 키워드입니다.

데이터 준비를 마치면 스키마 JSON 파일을 만들 준비가 된 것입니다. 이 파일은 Amazon Personalize에 데이터 구조에 대해 알려줍니다. 자세한 내용은 Personalize 스키마에 대한 스키마 JSON 파일 생성 단원을 참조하십시오. 위 샘플 데이터에 대한 스키마 JSON 파일은 다음과 같습니다.

{ "type": "record", "name": "Actions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ACTION_ID", "type": "string" }, { "name": "VALUE", "type": [ "null", "long" ] }, { "name": "MEMBERSHIP_LEVEL", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "REPEAT_FREQUENCY", "type": [ "long", "null" ] } ], "version": "1.0" }