Configurar colunas usadas durante o treinamento - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configurar colunas usadas durante o treinamento

Importante

Por padrão, todas as novas soluções usam treinamento automático. Com o treinamento automático, você incorre em custos de treinamento enquanto sua solução está ativa. Para evitar custos desnecessários, ao terminar, você poderá atualizar a solução para desativar o treinamento automático. Para obter informações sobre custos de treinamento, consulte os preços do Amazon Personalize.

Se a fórmula gerar recomendações de itens ou segmentos de usuários, será possível modificar as colunas utilizadas pelo Amazon Personalize ao criar uma versão da solução (treinar um modelo).

Você pode alterar as colunas usadas durante o treinamento para controlar quais dados o Amazon Personalize usa ao treinar um modelo (criar uma versão da solução). Você pode fazer isso para experimentar diferentes combinações de dados de treinamento. Ou você pode excluir colunas sem dados significativos. Por exemplo, pode haver uma coluna que você queira usar somente para filtrar recomendações. Você pode excluir essa coluna do treinamento, e o Amazon Personalize a considera somente durante a filtragem.

Você não pode excluir EVENT _ TYPE colunas. Por padrão, o Amazon Personalize usa todas as colunas que podem ser usadas durante o treinamento. Os seguintes dados são sempre excluídos do treinamento:

  • Colunas com o tipo de dados booleano

  • Dados de impressões

  • Campos de sequência de caracteres personalizados que não são categóricos ou textuais

Você não pode incluir dados de impressões no treinamento, mas se seu caso de uso ou receita os usar, o Amazon Personalize usa dados de impressões para orientar a exploração quando você recebe recomendações.

Se você já criou uma solução e deseja modificar as colunas que ela usa durante o treinamento, você pode clonar a solução. Ao clonar uma solução, você pode usar a configuração da solução atual como ponto de partida, como a fórmula e os hiperparâmetros, e fazer as alterações necessárias. Para obter mais informações, consulte Clonar uma solução (console).

Você pode configurar as colunas que o Amazon Personalize usa ao treinar com o console Amazon Personalize, AWS Command Line Interface (AWS CLI), ou AWS SDK. Para obter informações sobre como escolher colunas com o console do Amazon Personalize, consulte as etapas de configuração avançada em Criar uma solução (console). Depois de criar uma solução, você pode visualizar as colunas que a solução usa na página de detalhes da solução no console do Amazon Personalize ou com a operação DescribeSolution.

Configurando colunas usadas durante o treinamento (AWS CLI)

Para excluir colunas do treinamento, forneça o objeto excludedDatasetColumns na trainingDataConfig como parte da configuração da solução. Para cada chave, forneça o tipo de conjunto de dados. Para cada valor, forneça a lista de colunas a serem excluídas. O código a seguir mostra como excluir colunas do treinamento ao criar uma solução com o AWS CLI.

aws personalize create-solution \ --name solution name \ --dataset-group-arn dataset group ARN \ --recipe-arn recipe ARN \ --solution-config "{\"trainingDataConfig\": {\"excludedDatasetColumns\": { \"datasetType\" : [ \"column1Name\", \"column2Name\"]}}}"

Configurando colunas usadas durante o treinamento (AWS SDKs)

Para excluir colunas do treinamento, forneça o objeto excludedDatasetColumns na trainingDataConfig como parte da configuração da solução. Para cada chave, forneça o tipo de conjunto de dados. Para cada valor, forneça a lista de colunas a serem excluídas. O código a seguir mostra como excluir colunas do treinamento ao criar uma solução com o SDK for Python (Boto3).

import boto3 personalize = boto3.client('personalize') create_solution_response = personalize.create_solution( name = 'solution name', recipeArn = 'recipe ARN', datasetGroupArn = 'dataset group ARN', solutionConfig = { "trainingDataConfig": { "excludedDatasetColumns": { "datasetType": ["COLUMN_A", "COLUMN_B"] } } } ) solution_arn = create_solution_response['solutionArn'] print('solution_arn: ', solution_arn)