Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de JSON archivos de esquema para los esquemas de Amazon Personalize
Tras preparar los datos, estará listo para crear JSON archivos de esquema para cada tipo de datos que vaya a importar. Estos archivos describen la estructura y el contenido de los datos, incluidos los nombres de las columnas y sus tipos de datos.
JSONLos archivos de esquema se utilizan cuando se crea un esquema de Amazon Personalize enCrear un esquema y un conjunto de datos. En Amazon Personalize, un esquema es un recurso que permite a Amazon Personalize analizar los datos cuando los importa a su conjunto de datos. Usted crea un esquema para cada conjunto de datos que utilice.
En el caso de los recursos personalizados, cada conjunto de datos tiene requisitos de esquema específicos. En el caso de los grupos de conjuntos de datos de dominio, el dominio que elija determina los requisitos del conjunto de datos y el esquema. Cada dominio tiene un esquema predeterminado para cada tipo de conjunto de datos. Al crear un conjunto de datos, puede usar el esquema de dominio existente o crear uno nuevo modificando el esquema predeterminado existente. Use el esquema predeterminado como guía para saber qué datos importar para su dominio.
En las siguientes secciones, se proporcionan los requisitos personalizados y de dominio para crear un JSON archivo de esquema para cada tipo de conjunto de datos.
Temas
Requisitos de formato de esquema
Al crear un esquema para un conjunto de datos en un grupo de conjuntos de datos de dominio o un grupo de conjuntos de datos personalizados, debe seguir estas pautas:
-
Debe definir el esquema en formato Avro
. Para obtener información sobre los tipos de datos de Avro que admitimos, consulte Tipos de datos de esquema. -
Un esquema tiene una clave de nombre cuyo valor debe coincidir con el tipo de conjunto de datos.
-
Los campos del esquema pueden aparecer en cualquier orden, pero deben coincidir con el orden de los encabezados de las columnas correspondientes del CSV archivo.
-
Los esquemas deben ser JSON archivos planos sin estructuras anidadas. Por ejemplo, un campo no puede ser el principal de varios subcampos.
-
Los esquemas de Amazon Personalize no admiten tipos complejos, como matrices y mapas.
-
Los campos de esquema deben tener nombres alfanuméricos únicos. Por ejemplo, no puede agregar un campo
GENRES_FIELD_1
y un campoGENRESFIELD1
a la vez. -
Debe definir campos obligatorios con sus tipos de datos obligatorios. Los campos de cadenas categóricas reservadas deben tener el atributo
categorical
establecido entrue
, mientras que los campos de cadenas reservadas no pueden ser categóricos. Las palabras clave no pueden estar en sus datos. -
Si agrega su propio campo de metadatos de tipo
string
y quiere que Amazon Personalize lo utilice durante el entrenamiento, debe incluir el atributocategorical
o el atributotextual
(solo los esquemas de elementos admiten campos con el atributo textual). -
Amazon Personalize no utiliza datos de tipo
boolean
al entrenar o filtrar recomendaciones. Para que Amazon Personalize utilice datos booleanos al entrenar o filtrar, utilice un campo de tipo Cadena y utilice los valores"True"
y"False"
de sus datos. También puede usar el tipo int o long, y los valores0
y1
. -
Los campos textuales deben ser del tipo
string
y deben tener el atributotextual
establecido entrue
. Para obtener más información acerca de datos de texto no estructurados, consulte Metadatos de texto no estructurado.
Los conjuntos de datos de grupos de conjuntos de datos de dominio tienen requisitos adicionales según el dominio y el tipo de conjunto de datos. Los conjuntos de datos de grupos de conjuntos de datos personalizados tienen requisitos adicionales según el tipo.
Tipos de datos de esquema
Los esquemas de Amazon Personalize admiten los siguientes tipos de Avro para los campos:
-
float
-
double
-
int
-
long
-
cadena
-
boolean
-
null
Algunos campos obligatorios y reservados admiten datos nulos. La adición de un tipo de null
a un campo le permite usar datos imperfectos (por ejemplo, metadatos con valores en blanco) para generar recomendaciones. Para obtener información sobre los campos que admiten datos nulos, consulta el tema sobre los requisitos del esquema para tu dominio:VIDEOConjuntos de datos y esquemas DEMAND _ON_,ECOMMERCEconjuntos de datos y esquemas, o. Esquemas y conjuntos de datos personalizados En el siguiente ejemplo, se muestra cómo añadir un tipo nulo a un GENDER campo.
{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }