기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
교육에 사용할 항목 상호 작용 데이터 선택
중요
기본적으로 모든 새 솔루션은 자동 학습을 사용합니다. 자동 학습을 사용하면 솔루션이 활성화되어 있는 동안 학습 비용이 발생합니다. 불필요한 비용을 방지하기 위해 완료되면 솔루션을 업데이트하여 자동 학습을 끌 수 있습니다. 학습 비용에 대한 자세한 내용은 Amazon Personalize 요금
솔루션 버전을 생성(모델 교육)할 때 Amazon Personalize가 사용하는 항목 상호 작용 데이터 세트의 이벤트를 선택할 수 있습니다. 교육 전에 항목 상호 작용 데이터를 선택하면 관련 데이터 하위 집합만 교육에 사용하거나 노이즈를 제거하여 더 최적화된 모델을 교육할 수 있습니다. 항목 상호 작용 데이터세트에 대한 자세한 내용은 항목 상호 작용 데이터 섹션을 참조하세요.
참고
User-Personalization-v2 또는 Personalized-Ranking-v2를 사용하는 경우 훈련 비용은 이벤트 유형 또는 값을 기준으로 필터링하기 전에 항목 상호 작용 데이터를 기반으로 합니다. 요금에 대한 자세한 내용은 Amazon Personalize 요금
항목 상호 작용 데이터는 다음과 같이 선택할 수 있습니다.
-
유형에 따라 레코드 선택 - 솔루션을 구성할 때 항목 상호 작용 데이터 세트에 EVENT_TYPE 열에 이벤트 유형이 포함된 경우 선택적으로 훈련에 사용할 이벤트 유형을 지정할 수 있습니다. 예를 들어, 항목 상호 작용 데이터 세트에 구매, 클릭 및 시청 이벤트 유형이 포함되어 있고 Amazon Personalize가 시청 이벤트만 사용하여 모델을 교육하도록 하려는 경우, 솔루션을 구성할 때 Amazon Personalize가 교육에 사용하는
event type
과 동일한 시청을 제공하면 됩니다.항목 상호 작용 데이터 세트에 EVENT_TYPE 열에 여러 이벤트 유형이 있고 솔루션을 구성할 때 이벤트 유형을 제공하지 않는 경우 Personalize는 유형에 관계없이 동일한 가중치로 훈련하기 위해 모든 항목 상호 작용 데이터를 사용합니다.
-
유형 및 값을 기준으로 레코드 선택 - 솔루션을 구성할 때 항목 상호 작용 데이터 세트에 EVENT_TYPE 및 EVENT_VALUE 필드가 포함된 경우 특정 값을 임계값으로 설정하여 훈련에서 레코드를 제외할 수 있습니다. 예를 들어, EVENT_VALUE의 시계가 있는 이벤트에 대한 EVENT_TYPE 데이터가 사용자가 시청한 비디오의 백분율인 경우 이벤트 값 임계값을 0.5로 설정하고 시청할 이벤트 유형을 설정하면 Personalize는 EVENT_VALUE가 0.5 이상인 시계 상호 작용 이벤트만 사용하여 모델을 훈련합니다.
다음 코드는 SDK for Python(Boto3)을 사용하여 비디오의 절반 이상을 시청한 watch
이벤트만 사용하는 솔루션을 생성하는 방법을 보여줍니다.
import boto3
personalize = boto3.client('personalize')
create_solution_response = personalize.create_solution(
name = 'solution name',
datasetGroupArn = 'arn:aws:personalize:region:accountId:dataset-group/datasetGroupName',
recipeArn = 'arn:aws:personalize:::recipe/aws-user-personalization-v2',
eventType = 'watch',
solutionConfig = {
"eventValueThreshold": "0.5"
}
)
# Store the solution ARN
solution_arn = create_solution_response['solutionArn']
# Use the solution ARN to get the solution status
solution_description = personalize.describe_solution(solutionArn = solution_arn)['solution']
print('Solution status: ' + solution_description['status'])