훈련을 위한 행동 상호작용 데이터 준비 - Personalize

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

훈련을 위한 행동 상호작용 데이터 준비

Next-Best-Action 사용자 지정 레시피를 사용하는 경우 Amazon Personalize는 행동 상호 작용 데이터를 사용하여 사용자의 관심을 파악하고 사용자가 취할 가능성이 가장 높은 조치를 예측합니다. 작업 상호 작용은 작업 데이터 세트에 있는 사용자와 작업을 포함하는 상호 작용입니다. 예를 들어, 작업 데이터 세트에 등록 작업이 있고 사용자가 이 작업을 수행하는 경우 사용자 ID, 작업 ID, 타임스탬프를 기록하고 이벤트 유형에는 TAKEN을 기록합니다.

작업 상호 작용을 Amazon Personalize 작업 상호 작용 데이터 세트로 가져옵니다. 데이터 세트 가져오기 작업을 통해 작업 상호 작용 이벤트를 대량으로 가져오거나 작업과 함께 실시간으로 스트리밍할 수 있습니다. PutActionInteractions API 도메인 데이터세트 그룹에는 액션 및 액션 인터랙션 데이터세트를 비롯한 차선책 액션 리소스를 생성할 수 없습니다.

대량 작업 상호작용 데이터는 파일에 있어야 합니다. CSV 파일의 각 행은 사용자와 작업 간의 고유한 상호 작용을 나타내야 합니다. 데이터 준비를 마치면 스키마 JSON 파일을 만들 준비가 된 것입니다. 이 파일은 Amazon Personalize에 데이터 구조에 대해 알려줍니다. 자세한 내용은 Personalize 스키마에 대한 스키마 JSON 파일 생성 단원을 참조하십시오.

다음 섹션에서는 Amazon Personalize를 위한 작업 상호 작용 데이터를 준비하는 방법에 대한 자세한 정보를 제공합니다. 모든 유형의 데이터에 대한 대량 데이터 형식 지침은 대량 데이터 형식 지침을 참조하십시오.

액션 인터랙션 데이터 요구 사항

작업 상호 작용 데이터에 대한 최소 요구 사항은 없습니다. 품질 작업 추천을 위해서는 데이터를 가져오는 것이 좋습니다. 액션 인터랙션 데이터가 없는 경우 빈 액션 상호작용 데이터세트를 만들고 작업을 사용하여 고객과 액션의 상호작용을 기록할 수 있습니다. PutActionInteractions API

액션 인터랙션 데이터에는 최소한 다음과 같은 열이 있어야 합니다. 사용 사례와 데이터에 따라 사용자 지정 열을 자유롭게 추가할 수 있습니다.

  • USER_ID — 항목과 상호작용한 사용자의 고유 식별자입니다. 모든 이벤트에는 _ID가 USER 있어야 합니다. stringa여야 하며 최대 길이는 256자여야 합니다.

  • ACTION_ID — 사용자가 상호작용한 항목의 고유 식별자입니다. 모든 이벤트에는 항목 ID가 있어야 합니다. stringa여야 하며 최대 길이는 256자여야 합니다.

  • TIMESTAMP— 이벤트가 발생한 시간 (Unix epoch 시간 형식 (초 단위)) 모든 액션 인터랙션에는 a가 있어야 합니다. TIMESTAMP 자세한 내용은 타임스탬프 데이터 단원을 참조하십시오.

  • EVENT_ TYPE — 조치를 취했는지, 취하지 않았는지, 확인했는지 여부. 모든 액션 인터랙션에는 이벤트 유형이 있어야 합니다. 자세한 내용은 이벤트 유형 데이터 단원을 참조하십시오.

행동 상호 작용 데이터를 가져올 때까지 Amazon Personalize는 개인화가 없는 사용자의 행동을 권장하며 성향 점수는 0.0입니다. 액션이 다음과 같은 조건을 충족하면 액션에 점수가 부여됩니다.

  • TAKEN이벤트 유형과의 작업 상호 작용이 50회 이상 있어야 합니다.

  • NOT_ TAKEN 또는 VIEWED 이벤트 유형과의 동작 상호 작용 50개 이상

이러한 액션 인터랙션은 최신 솔루션 버전 교육 시 존재해야 하며, 액션 인터랙션 데이터셋의 최신 인터랙션 타임스탬프로부터 6주 이내에 발생해야 합니다.

이벤트 유형 데이터

Amazon Personalize는 이벤트 유형 데이터의 패턴을 활용하여 사용자가 수행할 가능성이 가장 높은 작업을 식별할 수 있습니다. 예를 들어 고객이 이메일 구독 작업 (NOT_ TAKEN 이벤트 유형으로 표시) 을 자주 무시하는 경우 Amazon Personalize는 이러한 유형의 작업을 더 적게 포함하도록 권장 사항을 조정할 수 있습니다.

작업 상호 작용 이벤트에는 다음 이벤트 유형만 사용할 수 있습니다. Amazon Personalize는 이러한 이벤트를 통해 사용자에 대해 파악하고 다음에 추천할 작업을 추정합니다.

  • Taken – 사용자가 추천 작업을 실행할 때 Taken 이벤트가 기록됩니다.

  • Not Taken – 사용자가 작업을 본 후 작업을 실행하지 않기로 의도적으로 선택한 경우 Not Taken 이벤트가 기록됩니다. 작업을 보여줄 때 아니요를 선택하는 경우를 예로 들 수 있습니다. Not Taken 이벤트는 고객이 해당 작업에 관심이 없음을 의미할 수 있습니다.

  • Viewed – 작업을 수행할지 여부를 결정하기 전에 사용자에게 작업을 보여주면 Viewed 이벤트가 기록됩니다. Amazon Personalize는 View 이벤트를 통해 사용자의 관심도를 파악합니다. 예를 들어, 사용자가 작업을 보고 실행하지 않는 경우 이 사용자는 앞으로 해당 작업에 관심이 없을 수 있습니다.

액션 인터랙션 데이터 예제

동작 상호 작용 데이터와 모든 필수 열이 포함된 CSV 파일의 처음 몇 줄은 다음과 같을 수 있습니다.

USER_ID,ACTION_ID,EVENT_TYPE,TIMESTAMP 35,73,Viewed,1586731606 54,35,Not taken,1586731609 9,33,Viewed,1586735158 23,10,Taken,1586735697 27,11,Taken,1586735763 ... ...

데이터 준비를 마치면 스키마 JSON 파일을 만들 준비가 된 것입니다. 이 파일은 Amazon Personalize에 데이터 구조에 대해 알려줍니다. 자세한 내용은 Personalize 스키마에 대한 스키마 JSON 파일 생성 단원을 참조하십시오. 위 샘플 데이터에 대한 스키마 JSON 파일은 다음과 같습니다.

{ "type": "record", "name": "ActionInteractions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ACTION_ID", "type": "string" }, { "name": "EVENT_TYPE", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }