Esquemas y conjuntos de datos personalizados
Cuando crea un grupo de conjuntos de datos personalizados, crea sus propios esquemas desde cero. Los conjuntos de datos y esquemas de grupos de conjuntos de datos personalizados tienen menos campos obligatorios y mayor flexibilidad. En los siguientes temas se explican los requisitos de esquema y de datos para los conjuntos de datos de un grupo de conjuntos de datos personalizados. Cada sección del conjunto de datos enumera los datos necesarios para el tipo de conjunto de datos y proporciona un ejemplo de JSON de un esquema.
Para obtener información sobre los tipos de datos que puede importar en Amazon Personalize, consulte Tipos de datos que Amazon Personalize puede utilizar. Para obtener información sobre los requisitos generales de esquema de Amazon Personalize, como los requisitos de formato y los tipos de datos de campo disponibles, consulte Creación de archivos JSON de esquema para los esquemas de Amazon Personalize. Estos requisitos se aplican a todos los esquemas de Amazon Personalize.
Temas
- Requisitos de esquemas y conjuntos de datos personalizados
- Requisitos del esquema del conjunto de datos de interacciones de elementos (personalizado)
- Requisitos del esquema del conjunto de datos de usuarios (personalizado)
- Requisitos del esquema del conjunto de datos de elementos (personalizado)
- Requisitos del esquema del conjunto de datos de acciones (personalizado)
- Requisitos del esquema del conjunto de datos de interacciones de acción (personalizado)
Requisitos de esquemas y conjuntos de datos personalizados
Al crear un conjunto de datos para un grupo de conjuntos de datos personalizados, cada tipo de conjunto de datos tiene los siguientes campos obligatorios y palabras clave reservadas con los tipos de datos obligatorios.
Tipo de conjunto de datos | Campos obligatorios | Palabras clave reservadas |
---|---|---|
Interacciones de elementos (ejemplo de esquema) |
USER_ID ( ITEM_ID ( TIMESTAMP ( |
EVENT_TYPE ( EVENT_VALUE ( IMPRESSION ( RECOMMENDATION_ID ( EVENT_ATTRIBUTION_SOURCE ( |
Usuarios (ejemplo de esquema) |
USER_ID ( 1 campo de metadatos ( |
|
Elementos (ejemplo de esquema) |
ITEM_ID ( 1 campo de metadatos (campo |
CREATION_TIMESTAMP ( |
Acciones (ejemplo de esquema) |
ACTION_ID ( 1 campo de metadatos ( |
CREATION_TIMESTAMP ( VALUE ( TYPE ( EXPIRATION_TIMESTAMP ( REPEAT_FREQUENCY ( |
Interacciones de acción (ejemplo de esquema) |
USER_ID ( ACTION_ID ( EVENT_TYPE ( TIMESTAMP ( |
IMPRESSION ( RECOMMENDATION_ID ( |
Campos de metadatos
Los metadatos incluyen campos de cadena o sin cadena que no son obligatorios o que no utilizan una palabra clave reservada. Los esquemas de metadatos tienen las siguientes restricciones:
-
Los esquemas de usuarios, elementos y acciones requieren al menos un campo de metadatos.
-
Puede agregar como máximo 25 campos de metadatos para un esquema de usuarios, 100 campos de metadatos para un esquema de elementos y 10 campos de metadatos para un esquema de acciones.
-
Si agrega su propio campo de metadatos de tipo
string
, debe incluir el atributocategorical
o el atributotextual
(solo los esquemas de elementos admiten campos con el atributo textual). De lo contrario, Amazon Personalize no utilizará el campo al entrenar un modelo.
Palabras clave reservadas
Las palabras clave reservadas son campos opcionales que no son de metadatos. Estos campos se consideran reservados porque debe definirlos como su tipo de datos obligatorio al usarlos, y las palabras clave no se pueden usar como valores en sus datos. Los campos de cadenas categóricas reservadas deben tener categorical
establecido en true
, mientras que los campos de cadenas reservadas no pueden ser categóricos. Las siguientes son palabras clave reservadas:
-
EVENT_TYPE: para los conjuntos de datos de interacciones de elementos con uno o más tipos de eventos, como hacer clic y descargar, use un campo
EVENT_TYPE
. Debe definir un campo EVENT_TYPE comostring
y no puede establecerse como categórico. -
EVENT_VALUE: para los conjuntos de datos de interacciones de elementos que incluyen datos de valor para los eventos, como el porcentaje de un vídeo que ha visto un usuario, use un campo
EVENT_VALUE
con el tipofloat
y, de forma opcional,null
. -
CREATION_TIMESTAMP: para los conjuntos de datos de elementos o acciones con una marca de tiempo para la fecha de creación de cada elemento, use un campo
CREATION_TIMESTAMP
con un tipolong
. Amazon Personalize utiliza los datos deCREATION_TIMESTAMP
para calcular la edad de un elemento y ajustar las recomendaciones en consecuencia. Consulte Datos de la marca de tiempo de creación. -
IMPRESSION: para los conjuntos de datos de interacciones de elementos con datos de impresiones explícitos, utilice un campo
IMPRESSION
con el tipoString
y, si lo desea, el tiponull
. Las impresiones son listas de elementos que estaban visibles para un usuario cuando interactuaba con un elemento concreto (por ejemplo, al hacer clic o verlo). Para obtener más información, consulte Datos de impresiones. -
RECOMMENDATION_ID: para los conjuntos de datos de interacciones de elementos que utilizan recomendaciones anteriores como datos de impresiones implícitas, si lo desea, utilice un campo
RECOMMENDATION_ID
con el tipoString
y, opcionalmente, el tiponull
.No es necesario añadir un campo
RECOMMENDATION_ID
para que Amazon Personalize utilice impresiones implícitas al generar recomendaciones. Puede pasar un valor derecommendationId
en una operación PutEvents sin él. Para obtener más información, consulte Datos de impresiones. -
VALUE: para los conjuntos de datos de acciones, si tiene datos de valor para algunas de sus acciones o todas, agregue un campo
VALUE
al esquema. Para el tipo, uselong
y, si lo desea, escribanull
. Para obtener más información sobre las acciones y su valor, consulte Value data. -
ACTION_EXPIRATION_TIMESTAMP: para los conjuntos de datos de acciones, si tiene una marca de tiempo de caducidad para algunas de sus acciones o todas, agregue un campo
ACTION_EXPIRATION_TIMESTAMP
al esquema. Para el tipo, uselong
y, si lo desea, escribanull
. Para obtener más información sobre las marcas de tiempo de caducidad, consulte Datos de la marca de tiempo de caducidad de la acción. -
REPEAT_FREQUENCY: para los conjuntos de datos de acciones, si tiene datos de frecuencia de repetición para algunas de sus acciones o todas, agregue un campo
REPEAT_FREQUENCY
al esquema. Para el tipo, uselong
y, si lo desea, escribanull
. Para obtener más información sobre los datos de frecuencia de repetición, consulte Datos de frecuencia de repetición.