Esquemas y conjuntos de datos personalizados - Amazon Personalize

Esquemas y conjuntos de datos personalizados

Cuando crea un grupo de conjuntos de datos personalizados, crea sus propios esquemas desde cero. Los conjuntos de datos y esquemas de grupos de conjuntos de datos personalizados tienen menos campos obligatorios y mayor flexibilidad. En los siguientes temas se explican los requisitos de esquema y de datos para los conjuntos de datos de un grupo de conjuntos de datos personalizados. Cada sección del conjunto de datos enumera los datos necesarios para el tipo de conjunto de datos y proporciona un ejemplo de JSON de un esquema.

Para obtener información sobre los tipos de datos que puede importar en Amazon Personalize, consulte Tipos de datos que Amazon Personalize puede utilizar. Para obtener información sobre los requisitos generales de esquema de Amazon Personalize, como los requisitos de formato y los tipos de datos de campo disponibles, consulte Creación de archivos JSON de esquema para los esquemas de Amazon Personalize. Estos requisitos se aplican a todos los esquemas de Amazon Personalize.

Requisitos de esquemas y conjuntos de datos personalizados

Al crear un conjunto de datos para un grupo de conjuntos de datos personalizados, cada tipo de conjunto de datos tiene los siguientes campos obligatorios y palabras clave reservadas con los tipos de datos obligatorios.

Tipo de conjunto de datos Campos obligatorios Palabras clave reservadas
Interacciones de elementos (ejemplo de esquema)

USER_ID (string)

ITEM_ID (string)

TIMESTAMP (long)

EVENT_TYPE (string)

EVENT_VALUE (float, null)

IMPRESSION (string, null)

RECOMMENDATION_ID (string, null)

EVENT_ATTRIBUTION_SOURCE (string, null)

Usuarios (ejemplo de esquema)

USER_ID (string)

1 campo de metadatos (string categórica o numérica)

Elementos (ejemplo de esquema)

ITEM_ID (string)

1 campo de metadatos (campo string categórico o textual o campo numérico)

CREATION_TIMESTAMP (long)

Acciones (ejemplo de esquema)

ACTION_ID (string)

1 campo de metadatos (string categórica o numérica)

CREATION_TIMESTAMP (long)

VALUE (long, null)

TYPE (string, null)

EXPIRATION_TIMESTAMP (long, null)

REPEAT_FREQUENCY (long, null)

Interacciones de acción (ejemplo de esquema)

USER_ID (string)

ACTION_ID (string)

EVENT_TYPE (string)

TIMESTAMP (long)

IMPRESSION (string, null)

RECOMMENDATION_ID (string, null)

Campos de metadatos

Los metadatos incluyen campos de cadena o sin cadena que no son obligatorios o que no utilizan una palabra clave reservada. Los esquemas de metadatos tienen las siguientes restricciones:

  • Los esquemas de usuarios, elementos y acciones requieren al menos un campo de metadatos.

  • Puede agregar como máximo 25 campos de metadatos para un esquema de usuarios, 100 campos de metadatos para un esquema de elementos y 10 campos de metadatos para un esquema de acciones.

  • Si agrega su propio campo de metadatos de tipo string, debe incluir el atributo categorical o el atributo textual (solo los esquemas de elementos admiten campos con el atributo textual). De lo contrario, Amazon Personalize no utilizará el campo al entrenar un modelo.

Palabras clave reservadas

Las palabras clave reservadas son campos opcionales que no son de metadatos. Estos campos se consideran reservados porque debe definirlos como su tipo de datos obligatorio al usarlos, y las palabras clave no se pueden usar como valores en sus datos. Los campos de cadenas categóricas reservadas deben tener categorical establecido en true, mientras que los campos de cadenas reservadas no pueden ser categóricos. Las siguientes son palabras clave reservadas:

  • EVENT_TYPE: para los conjuntos de datos de interacciones de elementos con uno o más tipos de eventos, como hacer clic y descargar, use un campo EVENT_TYPE. Debe definir un campo EVENT_TYPE como string y no puede establecerse como categórico.

  • EVENT_VALUE: para los conjuntos de datos de interacciones de elementos que incluyen datos de valor para los eventos, como el porcentaje de un vídeo que ha visto un usuario, use un campo EVENT_VALUE con el tipo float y, de forma opcional, null.

  • CREATION_TIMESTAMP: para los conjuntos de datos de elementos o acciones con una marca de tiempo para la fecha de creación de cada elemento, use un campo CREATION_TIMESTAMP con un tipo long. Amazon Personalize utiliza los datos de CREATION_TIMESTAMP para calcular la edad de un elemento y ajustar las recomendaciones en consecuencia. Consulte Datos de la marca de tiempo de creación.

  • IMPRESSION: para los conjuntos de datos de interacciones de elementos con datos de impresiones explícitos, utilice un campo IMPRESSION con el tipo String y, si lo desea, el tipo null. Las impresiones son listas de elementos que estaban visibles para un usuario cuando interactuaba con un elemento concreto (por ejemplo, al hacer clic o verlo). Para obtener más información, consulte Datos de impresiones.

  • RECOMMENDATION_ID: para los conjuntos de datos de interacciones de elementos que utilizan recomendaciones anteriores como datos de impresiones implícitas, si lo desea, utilice un campo RECOMMENDATION_ID con el tipo String y, opcionalmente, el tipo null.

    No es necesario añadir un campo RECOMMENDATION_ID para que Amazon Personalize utilice impresiones implícitas al generar recomendaciones. Puede pasar un valor de recommendationId en una operación PutEvents sin él. Para obtener más información, consulte Datos de impresiones.

  • VALUE: para los conjuntos de datos de acciones, si tiene datos de valor para algunas de sus acciones o todas, agregue un campo VALUE al esquema. Para el tipo, use long y, si lo desea, escriba null. Para obtener más información sobre las acciones y su valor, consulte Value data.

  • ACTION_EXPIRATION_TIMESTAMP: para los conjuntos de datos de acciones, si tiene una marca de tiempo de caducidad para algunas de sus acciones o todas, agregue un campo ACTION_EXPIRATION_TIMESTAMP al esquema. Para el tipo, use long y, si lo desea, escriba null. Para obtener más información sobre las marcas de tiempo de caducidad, consulte Datos de la marca de tiempo de caducidad de la acción.

  • REPEAT_FREQUENCY: para los conjuntos de datos de acciones, si tiene datos de frecuencia de repetición para algunas de sus acciones o todas, agregue un campo REPEAT_FREQUENCY al esquema. Para el tipo, use long y, si lo desea, escriba null. Para obtener más información sobre los datos de frecuencia de repetición, consulte Datos de frecuencia de repetición.