Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Preparación de los metadatos de los usuarios para la formación
Los datos de usuario que puede importar a Amazon Personalize incluyen datos numéricos, como la edad del usuario, y metadatos categóricos, como el sexo o la membresía de fidelidad. Los metadatos sobre los usuarios se importan en un conjunto de datos de Usuarios de Amazon Personalize.
Según el caso de uso del dominio o la receta personalizada, los metadatos de usuario pueden ayudar a Amazon Personalize a recomendar artículos más relevantes a los usuarios o a recomendar segmentos de usuarios más significativos. Además, tras la formación, pueden ayudar a tu modelo a recomendar artículos a los usuarios sin ningún dato de interacción. Para obtener más información sobre qué casos de uso o recetas utilizan metadatos de usuario, consulta los requisitos de datos para el caso de uso o la receta de tu dominio enHacer coincidir su caso de uso con los recursos de Amazon Personalize.
Durante la formación, Amazon Personalize no utiliza cadenas de datos de usuario no categóricas, como nombres de usuarios, palabras clave sobre el usuario o etiquetas. Sin embargo, la importación de estos datos puede mejorar las recomendaciones. Para obtener más información, consulte Datos de cadena no categóricos.
Para todos los casos de uso de dominios y recetas personalizadas, los datos de usuario masivos deben estar en un CSV archivo. Cada fila del archivo debe representar a un usuario único. Cuando termine de preparar los datos, estará listo para crear un JSON archivo de esquema. Este archivo informa a Amazon Personalize sobre la estructura de sus datos. Para obtener más información, consulte Creación de JSON archivos de esquema para los esquemas de Amazon Personalize.
En las siguientes secciones se proporciona más información sobre cómo preparar los datos de usuario para Amazon Personalize. Para ver las pautas de formato de datos masivos para todos los tipos de datos, consulte las pautas de formato de datos masivos
Temas
Requisitos de datos de usuario
Los siguientes son los requisitos de datos de usuario para Amazon Personalize. Puede añadir columnas personalizadas adicionales en función de su caso de uso y de sus datos.
-
Sus datos deben tener una columna USER _ID que almacene el identificador único de cada usuario. Cada usuario debe tener un seudónimo. Debe tener
string
una longitud máxima de 256 caracteres. -
Los datos deben tener al menos una cadena categórica o una columna de metadatos numéricos. Las columnas de metadatos de usuario pueden incluir valores vacíos o nulos para algunos usuarios. Se recomienda completar estas columnas al menos en un 70 por ciento.
-
El número máximo de columnas de metadatos es 25.
Si no está seguro de tener suficientes datos o si tiene dudas sobre su calidad, puede importar los datos a un conjunto de datos de Amazon Personalize y utilizar Amazon Personalize para analizarlos. Para obtener más información, consulte Análisis de la calidad y cantidad de datos en los conjuntos de datos de Amazon Personalize.
Metadatos categóricos
Con algunas recetas y todos los casos de uso de dominios, Amazon Personalize utiliza metadatos categóricos, como el sexo, los intereses o el estado de membresía del usuario, al identificar los patrones subyacentes que revelan los elementos más relevantes para sus usuarios. Puede definir su propio rango de valores en función de su caso de uso. Los metadatos categóricos pueden estar en cualquier idioma.
En el caso de los usuarios con varias categorías, separe cada valor con la barra vertical, «|». Por ejemplo, en el caso de un INTERESTS campo, los datos de un usuario podrían ser. Movies|TV Shows|Music
Con todas las recetas y dominios, puede importar metadatos categóricos y utilizarlos para filtrar las recomendaciones en función de los atributos de un usuario. Para obtener información acerca del filtrado de recomendaciones, consulte Recomendaciones de filtrado y segmentos de usuarios.
Los valores categóricos pueden tener 1000 caracteres como máximo. Si tiene un usuario con un valor categórico con más de 1000 caracteres, se generará un error en su trabajo de importación del conjunto de datos.
Datos de cadena no categóricos
A excepción del usuarioIDs, Amazon Personalize no utiliza cadenas de datos no categóricas durante el entrenamiento, como los nombres de los usuarios, las palabras clave sobre el usuario o las etiquetas. Sin embargo, Amazon Personalize puede utilizarla para filtrar recomendaciones. Puede crear filtros para incluir o eliminar elementos de las recomendaciones basándose en cadenas de datos no categóricas sobre el usuario al que va a recibir recomendaciones. CurrentUser Para obtener más información acerca de los filtros, consulte Recomendaciones de filtrado y segmentos de usuarios. Los valores no categóricos pueden tener un máximo de 1000 caracteres.
Ejemplo de metadatos de usuarios
Las primeras líneas de metadatos de usuario de un CSV archivo pueden tener el siguiente aspecto.
USER_ID,AGE,GENDER,INTEREST 5,34,Male,hiking 6,56,Female,music 8,65,Male,movies|TV shows|music ... ...
La USER_ID
columna es obligatoria y almacena los identificadores únicos de cada usuario individual. La AGE
columna son metadatos numéricos. Las INTEREST
columnas GENDER
y almacenan metadatos categóricos para cada usuario.
Cuando termine de preparar los datos, estará listo para crear un JSON archivo de esquema. Este archivo informa a Amazon Personalize sobre la estructura de sus datos. Para obtener más información, consulte Creación de JSON archivos de esquema para los esquemas de Amazon Personalize. Este es el aspecto que tendría el JSON archivo de esquema para los datos de ejemplo anteriores.
{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true }, { "name": "INTEREST", "type": "string", "categorical": true } ], "version": "1.0" }