Selecionar os dados de interações com itens utilizados para treinamento - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Selecionar os dados de interações com itens utilizados para treinamento

Importante

Depois de criar uma solução, você não pode alterar sua configuração. Por padrão, todas as novas soluções usam treinamento automático. Com o treinamento automático, você incorre em custos de treinamento enquanto sua solução está ativa. Para evitar custos desnecessários, certifique-se de excluir a solução quando terminar. Para obter informações sobre custos de treinamento, consulte os preços do Amazon Personalize.

Selecione os eventos em um conjunto de dados de interações com itens que o Amazon Personalize usa para criar uma versão da solução (treinar um modelo). Ao selecionar dados de interações com itens antes do treinamento, é possível usar somente um subconjunto relevante dos dados para treinamento ou remover ruídos para treinar um modelo mais otimizado. Para obter mais informações sobre conjuntos de dados de interações com itens, consulte Esquemas e Conjunto de dados de interações com itens.

nota

Se você usa User-Personalization-V2 ou Personalized-Ranking-V2, seu custo de treinamento é baseado nos dados de interações do item antes de filtrar por tipo ou valor do evento. Para obter mais informações sobre preços, consulte os preços do Amazon Personalize.

É possível selecionar dados de interações com itens da seguinte forma:

  • Selecionar registros com base no tipo: ao configurar uma solução, se o conjunto de dados de interações com itens incluir tipos de eventos em uma coluna EVENT_TYPE, será possível especificar um tipo de evento a ser usado no treinamento. Por exemplo, se o conjunto de dados de interações com itens incluir tipos de eventos comprar, clicar e assistir e você quiser que o Amazon Personalize treine o modelo apenas com eventos assistir, ao configurar a solução, você fornecerá assistir como o event type utilizado pelo Amazon Personalize no treinamento.

    Se o conjunto de dados de interações com itens tiver vários tipos de eventos em uma coluna EVENT_TYPE e você não fornecer um tipo de evento ao configurar a solução, o Amazon Personalize usará todos os dados de interações com itens para treinamento com o mesmo peso, independentemente do tipo.

  • Selecionar registros com base no tipo e no valor: ao configurar uma solução, se o conjunto de dados de interações com itens incluir os campos EVENT_TYPE e EVENT_VALUE, será possível definir um valor específico como limite para excluir registros do treinamento. Por exemplo, se seus dados de EVENT_VALUE para eventos com um EVENT_TYPE DE watch forem a porcentagem do vídeo que um usuário assistiu e você definir o limite do valor do evento como 0,5 e o tipo de evento como watch, o Amazon Personalize treinará o modelo usando somente eventos de interação de watch com EVENT_VALUE maior ou igual a 0,5.

O código a seguir mostra como usar o SDK para Python (Boto3) para criar uma solução que watch usa somente eventos em que o usuário assistiu a mais da metade do vídeo.

import boto3 personalize = boto3.client('personalize') create_solution_response = personalize.create_solution( name = 'solution name', datasetGroupArn = 'arn:aws:personalize:region:accountId:dataset-group/datasetGroupName', recipeArn = 'arn:aws:personalize:::recipe/aws-user-personalization-v2', eventType = 'watch', solutionConfig = { "eventValueThreshold": "0.5" } ) # Store the solution ARN solution_arn = create_solution_response['solutionArn'] # Use the solution ARN to get the solution status solution_description = personalize.describe_solution(solutionArn = solution_arn)['solution'] print('Solution status: ' + solution_description['status'])