Configuración de las columnas que se utilizan en el entrenamiento - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración de las columnas que se utilizan en el entrenamiento

importante

De forma predeterminada, todas las soluciones nuevas utilizan el entrenamiento automático. Con la formación automática, incurrirá en costes de formación mientras la solución esté activa. Para evitar costes innecesarios, cuando haya terminado, puede actualizar la solución para desactivar la formación automática. Para obtener información sobre los costes de formación, consulta los precios de Amazon Personalize.

Si su receta genera recomendaciones de elementos o segmentos de usuarios, puede modificar las columnas que Amazon Personalize tiene en cuenta al crear una versión de la solución (entrenamiento de un modelo).

Puede cambiar las columnas que se utilizan durante el entrenamiento para controlar los datos que Amazon Personalize utiliza al entrenar un modelo (creación de una versión de solución). Puede hacerlo para experimentar con diferentes combinaciones de datos de entrenamiento. O puede excluir columnas sin datos significativos. Por ejemplo, puede tener una columna que desee utilizar únicamente para filtrar recomendaciones. Puede excluir esta columna del entrenamiento y Amazon Personalize solo la tendrá en cuenta al filtrar.

No puede excluir TYPE las columnas EVENT _. De forma predeterminada, Amazon Personalize usa todas las columnas que se pueden usar durante el entrenamiento. Los siguientes datos siempre se excluyen del entrenamiento:

  • Columnas con el tipo de datos booleano

  • Datos de impresiones

  • Campos de cadenas personalizadas que no son categóricos ni textuales

No puedes incluir datos de impresiones en el entrenamiento, pero si tu caso de uso o receta los usa, Amazon Personalize usa los datos de impresiones para guiar la exploración cuando recibas recomendaciones.

Si ya ha creado una solución y desea modificar las columnas que utiliza durante el entrenamiento, puede clonar la solución. Al clonar una solución, puede utilizar la configuración de la solución existente como punto de partida, como la receta y los hiperparámetros, y realizar los cambios necesarios. Para obtener más información, consulte Clonación de una solución (consola).

Puedes configurar las columnas que Amazon Personalize usa cuando entrenas con la consola Amazon Personalize, AWS Command Line Interface (AWS CLI), o AWS SDK. Para obtener información acerca de cómo elegir columnas con la consola de Amazon Personalize, consulte los pasos de configuración avanzada en Creación de una solución (consola). Tras crear una solución, puede ver las columnas que utiliza la solución en la página de detalles de la solución de la consola de Amazon Personalize, o con la operación DescribeSolution.

Configuración de las columnas utilizadas durante el entrenamiento (AWS CLI)

Para excluir las columnas del entrenamiento, proporcione el objeto excludedDatasetColumns en el trainingDataConfig como parte de la configuración de la solución. Para cada clave, proporciona el tipo de conjunto de datos. Para cada valor, proporcione la lista de columnas que se excluirán. En el código siguiente se muestra cómo excluir columnas del entrenamiento al crear una solución con AWS CLI.

aws personalize create-solution \ --name solution name \ --dataset-group-arn dataset group ARN \ --recipe-arn recipe ARN \ --solution-config "{\"trainingDataConfig\": {\"excludedDatasetColumns\": { \"datasetType\" : [ \"column1Name\", \"column2Name\"]}}}"

Configurar las columnas utilizadas en el entrenamiento (AWS SDKs)

Para excluir las columnas del entrenamiento, proporcione el objeto excludedDatasetColumns en el trainingDataConfig como parte de la configuración de la solución. Para cada clave, proporciona el tipo de conjunto de datos. Para cada valor, proporcione la lista de columnas que se excluirán. El código siguiente muestra cómo excluir columnas del entrenamiento al crear una solución con Python (Boto3). SDK

import boto3 personalize = boto3.client('personalize') create_solution_response = personalize.create_solution( name = 'solution name', recipeArn = 'recipe ARN', datasetGroupArn = 'dataset group ARN', solutionConfig = { "trainingDataConfig": { "excludedDatasetColumns": { "datasetType": ["COLUMN_A", "COLUMN_B"] } } } ) solution_arn = create_solution_response['solutionArn'] print('solution_arn: ', solution_arn)