Preparar los metadatos de las acciones para el entrenamiento - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Preparar los metadatos de las acciones para el entrenamiento

Una acción es una actividad que genera ingresos o interacción y que puede que quiera recomendar a sus usuarios. Entre las acciones puede incluirse instalar su aplicación móvil, completar un perfil de pertenencia a grupo, unirse a un programa de fidelización o registrarse para recibir correos electrónicos promocionales. Los datos sobre sus acciones se importan en un conjunto de datos de acciones de Amazon Personalize. Entre los ejemplos de datos de una acción se incluyen el identificador único de la acción, el valor estimado de la acción o la fecha de caducidad de la acción.

Si utilizas Next-Best-Action, debes importar los metadatos de la acción. Con esta receta, Amazon Personalize predice cuál será la siguiente mejor acción entre las acciones que importe a su conjunto de datos de acciones. Ninguna otra receta o caso de uso utiliza metadatos de acciones. No puedes crear un conjunto de datos de acciones en un grupo de conjuntos de datos de dominio.

Durante el entrenamiento, Amazon Personalize no utiliza datos de acciones de cadena no categóricos, como títulos o etiquetas de acciones. Sin embargo, la importación de estos datos puede mejorar las recomendaciones. Para obtener más información, consulte Datos de cadena no categóricos.

Los datos de tus acciones masivas deben estar en un CSV archivo. Cada fila del archivo debe representar una acción única. Cuando termine de preparar los datos, estará listo para crear un JSON archivo de esquema. Este archivo informa a Amazon Personalize sobre la estructura de sus datos. Para obtener más información, consulte Creación de JSON archivos de esquema para los esquemas de Amazon Personalize.

En las siguientes secciones se proporciona más información sobre cómo preparar los metadatos de las acciones para Amazon Personalize. Para ver las pautas de formato de datos masivos para todos los tipos de datos, consulte las pautas de formato de datos masivos

Requisitos de datos de acción

Los siguientes son los requisitos de datos de acción para Amazon Personalize.

  • Debe tener una columna ACTION _ID que almacene el identificador único de cada acción. Cada acción debe tener un identificador de elemento. Debe tener string una longitud máxima de 256 caracteres.

  • Los datos deben tener al menos una cadena categórica o una columna de metadatos numéricos. Las columnas de metadatos de acciones pueden incluir valores vacíos o nulos. Se recomienda completar estas columnas al menos en un 70 por ciento.

  • Durante el entrenamiento de modelos, Amazon Personalize tiene en cuenta un máximo de 1000 acciones. Si importa más de 1000 acciones, Amazon Personalize decide cuáles incluir en el entrenamiento, para lo que se da prioridad a las acciones nuevas (acciones que ha agregado recientemente sin interacciones) y las acciones existentes con datos de interacciones recientes.

  • El número máximo de columnas es 10.

Datos de la marca de tiempo de caducidad de la acción

La marca de tiempo de caducidad de una acción especifica la fecha en la que una acción deja de ser válida. Los datos de la marca de tiempo de caducidad de la acción se proporcionan en formato de tiempo Unix, en segundos. Si una acción ha caducado, Amazon Personalize no la incluirá en las recomendaciones.

Especifique una marca de tiempo de caducidad para sus acciones si quiere limitar su aparición en las recomendaciones a un período de tiempo determinado. Por ejemplo, puede que tenga una aplicación que ejecute una campaña de suscripción durante un mes determinado. Puede establecer una marca de tiempo de caducidad para la acción de inscribirse al final de ese mes. Amazon Personalize deja de recomendar esta acción automáticamente al llegar a esa fecha.

Si establece la marca de tiempo de caducidad en una fecha pasada para una nueva acción, o si actualiza la marca de tiempo de una acción a una fecha pasada, pueden tardarse hasta 2 horas en quitar la acción de las recomendaciones.

Datos de frecuencia de repetición

Los datos de frecuencia de repetición especifican cuántos días debe esperar Amazon Personalize para recomendar una acción determinada después de la interacción de un usuario, según el historial del usuario en su conjunto de datos de interacciones de acción. La frecuencia de repetición de una acción se especifica en días y el máximo es de 30.

Por ejemplo, puede que tenga una aplicación de comercio electrónico en la que cada usuario crea una cuenta y un perfil. Si tiene una acción complete profile y quiere esperar una semana después de que un usuario interactúe con ella antes de volver a recomendarla, debe especificar 7 días como valor REPEAT_FREQENCY de la acción. Transcurridos 7 días, Amazon Personalize empieza a tener en cuenta la acción para las recomendaciones.

Si no se especifica la frecuencia de repetición de una acción, Amazon Personalize no establecerá ningún límite respecto al número de veces que esta aparece en las recomendaciones.

Value data

Los datos de valor son el valor empresarial o la importancia de cada acción. El valor value de una acción puede oscilar entre 1 y 10, donde 10 es la acción más valiosa del conjunto de datos.

Por ejemplo, supongamos que tiene dos acciones: una para inscribirse en la suscripción básica y otra para inscribirse en el servicio premium. Para el servicio básico, puede especificar un valor de 5 y, para el premium, un valor de 10.

Amazon Personalize utiliza los datos de valor como una entrada al determinar la mejor acción para recomendar a los usuarios. Por ejemplo, si un usuario tiene la misma probabilidad de realizar una acción u otra, Amazon Personalize clasifica la acción con el valor más alto en una posición superior en las recomendaciones.

Datos de la marca de tiempo de creación

Amazon Personalize utiliza los datos de la marca de tiempo de creación (en formato de tiempo Unix, en segundos) para calcular la antigüedad de una acción y ajustar las recomendaciones en consecuencia.

Si no tiene datos de marca de tiempo de creación, Amazon Personalize deduce esta información de los datos de interacción de la acción. Utiliza la marca de tiempo de los datos de interacción más antiguos de la acción como marca de tiempo de creación de la acción. Si una acción no tiene datos de interacción, su marca de tiempo de creación se establece como la marca de tiempo de la última interacción del conjunto de entrenamiento y Amazon Personalize la considera una acción nueva.

Metadatos categóricos

Amazon Personalize utiliza metadatos categóricos sobre las acciones, como la estacionalidad o la exclusividad de las acciones, al identificar los patrones subyacentes que revelan las mejores acciones para los usuarios. Puede definir su propio rango de valores en función de su caso de uso. Los metadatos categóricos pueden estar en cualquier idioma.

Puede importar datos categóricos y usarlos para filtrar las recomendaciones en función de los atributos de una acción. Para obtener más información acerca del filtrado de recomendaciones, consulte Recomendaciones de filtrado y segmentos de usuarios.

Los valores categóricos pueden tener una longitud máxima de 1000 caracteres. Si tiene una acción con un valor categórico con más de 1000 caracteres, se generará un error en el trabajo de importación del conjunto de datos.

Datos de cadena no categóricos

A excepción de la acciónIDs, Amazon Personalize no utiliza cadenas de datos no categóricas durante el entrenamiento, como el nombre de una acción, las palabras clave sobre la acción o las etiquetas. Sin embargo, Amazon Personalize puede utilizarla para filtrar recomendaciones. Puede crear filtros para incluir o eliminar acciones de las recomendaciones basándose en cadenas de datos no categóricas. Para obtener más información acerca de los filtros, consulte Recomendaciones de filtrado y segmentos de usuarios. Los valores no categóricos pueden tener un máximo de 1000 caracteres.

Ejemplo de metadatos de acciones

Los primeros metadatos de las líneas de acción de un CSV archivo pueden tener el siguiente aspecto.

ACTION_ID,VALUE,MEMBERSHIP_LEVEL,CREATION_TIMESTAMP,REPEAT_FREQUENCY 1,10,Deluxe|Premium,1510003267,7 2,5,Basic,1580003267,7 3,5,Preview,1590003267,3 4,10,Deluxe|Platinum,1560003267,4 ... ...

La columna ACTION_ID es obligatoria. La MEMBERSHIP_LEVEL columna es un campo de cadena categórico. Los campos VALUE, CREATION_TIMESTAMP y REPEAT_FREQUENCY son palabras clave reservadas con los tipos necesarios.

Cuando termine de preparar los datos, estará listo para crear un JSON archivo de esquema. Este archivo informa a Amazon Personalize sobre la estructura de sus datos. Para obtener más información, consulte Creación de JSON archivos de esquema para los esquemas de Amazon Personalize. Este es el aspecto que tendría el JSON archivo de esquema para los datos de ejemplo anteriores.

{ "type": "record", "name": "Actions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ACTION_ID", "type": "string" }, { "name": "VALUE", "type": [ "null", "long" ] }, { "name": "MEMBERSHIP_LEVEL", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "REPEAT_FREQUENCY", "type": [ "long", "null" ] } ], "version": "1.0" }