Schemas - Amazon Personalize

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Schemas

Un esquema informa a Amazon Personalize de la estructura de sus datos y permite que Amazon Personalize analice los datos. Un esquema tiene una clave de nombre cuyo valor debe coincidir con el tipo de conjunto de datos. Una vez que se haya creado un esquema, no se podrán realizar cambios en él.

Para los grupos de conjuntos de datos de dominio, cada tipo de conjunto de datos tiene un esquema predeterminado con campos obligatorios y palabras clave reservadas. Cada vez que cree un conjunto de datos, puede usar el esquema de dominio existente o crear uno nuevo modificando el esquema predeterminado existente. Use el esquema predeterminado como guía para saber qué datos importar para su dominio. Una vez que defina el esquema y cree el conjunto de datos, no podrá realizar cambios en el esquema.

Requisitos de formato de esquema

Cuando crea un esquema para cualquiera de los conjuntos de datos de un grupo de conjuntos de datos de dominio o un grupo de conjuntos de datos personalizados, debe seguir estas directrices:

  • Debe definir el esquema en formato Avro. Para obtener información sobre los tipos de datos de Avro que admitimos, consulte Tipos de datos de esquema.

  • Los campos del esquema pueden aparecer en cualquier orden, pero deben coincidir con el orden de los encabezados de las columnas correspondientes del archivo. CSV

  • Los esquemas deben ser JSON archivos planos sin estructuras anidadas. Por ejemplo, un campo no puede ser el principal de varios subcampos.

  • Los esquemas de Amazon Personalize no admiten tipos complejos, como matrices y mapas.

  • Los campos de esquema deben tener nombres alfanuméricos únicos. Por ejemplo, no puede agregar un campo GENRES_FIELD_1 y un campo GENRESFIELD1 a la vez.

  • Debe definir campos obligatorios con sus tipos de datos obligatorios. Los campos de cadenas categóricas reservadas deben tener el atributo categorical establecido en true, mientras que los campos de cadenas reservadas no pueden ser categóricos. Las palabras clave no pueden estar en sus datos.

  • Si agrega su propio campo de metadatos de tipo string y quiere que Amazon Personalize lo utilice durante el entrenamiento, debe incluir el atributo categorical o el atributo textual (solo los esquemas de elementos admiten campos con el atributo textual).

  • Amazon Personalize puede utilizar columnas de cadenas no categóricas, como columnas de nombres de elementos, al generar temas, devolver metadatos en las recomendaciones y filtrar las recomendaciones. Para obtener más información, consulte Datos de cadena no categóricos.

  • Amazon Personalize no utiliza datos de tipo boolean al entrenar o filtrar recomendaciones. Para que Amazon Personalize utilice datos booleanos al entrenar o filtrar, utilice un campo de tipo Cadena y utilice los valores "True" y "False" de sus datos. También puede usar el tipo int o long, y los valores 0 y 1.

  • Los campos textuales deben ser del tipo string y deben tener el atributo textual establecido en true. Para obtener más información acerca de datos de texto no estructurados, consulte Metadatos de texto no estructurado.

Los conjuntos de datos de grupos de conjuntos de datos de dominio tienen requisitos adicionales según el dominio y el tipo de conjunto de datos. Los conjuntos de datos de grupos de conjuntos de datos personalizados tienen requisitos adicionales según el tipo.

Tipos de datos de esquema

Los esquemas de Amazon Personalize admiten los siguientes tipos de Avro para los campos:

  • float

  • double

  • int

  • long

  • cadena

  • boolean

  • null

Algunos campos obligatorios y reservados admiten datos nulos. La adición de un tipo de null a un campo le permite usar datos imperfectos (por ejemplo, metadatos con valores en blanco) para generar recomendaciones. Para obtener información sobre los campos que admiten datos nulos, consulte Esquemas y conjuntos de datos de dominio o Esquemas y conjuntos de datos personalizados. El siguiente ejemplo muestra cómo agregar un tipo nulo a un GENDER campo.

{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }