Criação de JSON arquivos de esquema para esquemas do Amazon Personalize - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criação de JSON arquivos de esquema para esquemas do Amazon Personalize

Depois de preparar seus dados, você estará pronto para criar JSON arquivos de esquema para cada tipo de dados que estiver importando. Esses arquivos descrevem a estrutura e o conteúdo dos seus dados, incluindo nomes de colunas e seus tipos de dados.

Você usa JSON arquivos de esquema ao criar um esquema do Amazon Personalize no. Criação de um esquema e um conjunto de dados No Amazon Personalize, um esquema é um recurso que permite que o Amazon Personalize analise os dados quando você os importa para seu conjunto de dados. Você cria um esquema para cada conjunto de dados que está usando.

Para recursos personalizados, cada conjunto de dados tem requisitos de esquema específicos. Para grupos de conjuntos de dados de domínio, o domínio escolhido determina seus requisitos de conjunto de dados e esquema. Cada domínio tem um esquema padrão para cada tipo de conjunto de dados. Ao criar um conjunto de dados, você pode usar o esquema de domínio existente ou criar um novo modificando o esquema padrão existente. Use o esquema padrão como um guia sobre quais dados importar para seu domínio.

As seções a seguir fornecem requisitos personalizados e de domínio para criar um JSON arquivo de esquema para cada tipo de conjunto de dados.

Requisitos de formatação do esquema

Ao criar um esquema para um conjunto de dados em um grupo de conjuntos de dados de domínio ou grupo de conjuntos de dados personalizados, você deve seguir estas diretrizes:

  • É necessário definir o esquema no formato Avro. Para obter informações sobre os tipos de dados Avro compatíveis, consulte Tipos de dados do esquema.

  • Um esquema tem uma chave de nome cujo valor deve corresponder ao tipo de conjunto de dados.

  • Os campos do esquema podem aparecer em qualquer ordem, mas devem corresponder à ordem dos cabeçalhos das colunas correspondentes em seu CSV arquivo.

  • Os esquemas devem ser JSON arquivos simples sem estruturas aninhadas. Por exemplo, um campo não pode ser o pai de vários subcampos.

  • Os esquemas do Amazon Personalize não oferecem suporte a tipos complexos, como matrizes e mapas.

  • Os campos do esquema devem ter nomes alfanuméricos exclusivos. Por exemplo, você não pode adicionar um campo GENRES_FIELD_1 e um campo GENRESFIELD1.

  • É necessário definir os campos obrigatórios como seus tipos de dados obrigatórios. Os campos de string de caracteres categóricos reservados devem ter o atributo categorical definido como true, enquanto os campos de string de caracteres reservados não podem ser categóricos. As palavras-chave não podem estar nos seus dados.

  • Se você adicionar o próprio campo de metadados do tipo string e quiser que o Amazon Personalize o use no treinamento, ele deverá incluir o atributo categorical ou textual (somente esquemas de itens aceitam campos com o atributo de texto).

  • O Amazon Personalize não usa dados do tipo boolean ao treinar ou filtrar recomendações. Para que o Amazon Personalize use dados booleanos ao treinar ou filtrar, use um campo do tipo String e use os valores "True" e "False" em seus dados. Outra opção é usar o tipo int ou long e valores 0 e 1.

  • Os campos textuais devem ser do tipo string e ter o atributo textual definido como true. Para obter mais informações sobre dados de texto não estruturados, consulte Metadados de texto não estruturados.

Os conjuntos de dados do grupo de conjuntos de dados de domínio têm requisitos adicionais com base no domínio e no tipo de conjunto de dados. Os conjuntos de dados de grupos de conjuntos de dados personalizados têm requisitos adicionais, dependendo do tipo.

Tipos de dados do esquema

Os esquemas do Amazon Personalize oferecem suporte aos seguintes tipos Avro para campos:

  • float

  • double

  • int

  • longo

  • string

  • boolean

  • null

Alguns campos obrigatórios e reservados oferecem suporte a dados nulos. Adicionar um tipo null a um campo permite que você use dados imperfeitos (por exemplo, metadados com valores em branco) para gerar recomendações. Para obter informações sobre quais campos oferecem suporte a dados nulos, consulte o tópico de requisitos de esquema para seu domínio:VIDEO_ON_ DEMAND conjuntos de dados e esquemas,ECOMMERCEconjuntos de dados e esquemas, ou. Conjuntos de dados personalizados e esquemas O exemplo a seguir mostra como adicionar um tipo nulo para um GENDER campo.

{ "name": "GENDER", "type": [ "null", "string" ], "categorical": true }