Requisitos do conjunto de dados de itens (domínio VIDEO_ON_DEMAND) - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Requisitos do conjunto de dados de itens (domínio VIDEO_ON_DEMAND)

Um conjunto de dados de itens armazena metadados sobre os itens do seu catálogo. Isso pode incluir informações como preço, gênero e disponibilidade para cada item. Para obter informações sobre os tipos de dados de item que você pode importar para o Amazon Personalize, consulte Metadados de itens. Para obter informações sobre os requisitos gerais de esquema do Amazon Personalize, como requisitos de formatação e tipos de dados de campo disponíveis, consulte Criar arquivos JSON de esquema para esquemas do Amazon Personalize. Esses requisitos aplicam-se a todos os esquemas, independentemente do domínio.

Um conjunto de dados de itens é necessário para alguns casos de uso (consulte Casos de uso VIDEO_ON_DEMAND). Mesmo quando opcional, ainda recomendamos criar um conjunto de dados de itens para obter as recomendações mais relevantes. Se você criar um conjunto de dados de itens, seu esquema deverá incluir os seguintes campos:

  • ITEM_ID

  • GENRES (string categóricos)

  • CREATION_TIMESTAMP (no formato de hora Unix epoch)

Seu esquema também pode incluir as seguintes palavras-chave reservadas. Cada palavra-chave lista o tipo de dados necessário e se ela permite dados nulos. Adicionar o tipo nulo é opcional.

  • PRICE (float)

  • DURATION (float)

  • GENRE_L2 (string categórico, null)

  • GENRE_L3 (string categórico, null)

  • AVERAGE_RATING (float, null)

  • PRODUCT_DESCRIPTION (string textual, null)

  • CONTENT_OWNER (string categórico,null): a empresa proprietária do vídeo. Por exemplo, os valores podem ser HBO, Paramount e NBC.

  • CONTENT_CLASSIFICATION (string categórico, null): a classificação do conteúdo. Por exemplo, os valores podem ser G, PG, PG-13, R, NC-17 e sem classificação.

Para obter as recomendações melhores, recomendamos que você mantenha uma quantidade desses campos em seu esquema equivalente aos dados que você tiver. Os dados que você importa devem corresponder ao seu esquema. O número máximo de colunas de metadados é 100. Você pode adicionar outros campos, dependendo do seu caso de uso e dos seus dados. Desde que os campos não estejam listados como obrigatórios ou reservados e os tipos de dados estejam listados em Tipos de dados do esquema, é você quem escolhe os nomes e tipos de dados dos campos.

Use as palavras-chave reservadas GENRE_L2 e GENRE_L3 para itens com várias categorias de vários níveis. Para obter mais informações, consulte Usar dados categóricos. Para obter informações sobre metadados textuais e categóricos, consulte Preparar metadados do item para treinamento. Para obter um exemplo do esquema padrão para conjuntos de dados de itens para domínios ECOMMERCE, consulte Esquema de itens padrão (domínio VIDEO_ON_DEMAND).

Usar dados categóricos

Para usar dados categóricos, adicione um campo do tipo string e defina o atributo categórico do campo como true em seu esquema. Em seguida, inclua os dados categóricos no arquivo CSV em massa e nas importações de itens individuais. Os valores categóricos podem ter no máximo 1.000 caracteres. Se você tiver um item com um valor categórico com mais de 1.000 caracteres, sua tarefa de importação do conjunto de dados falhará.

Para itens com várias categorias, separe cada valor com a barra vertical '|'. Por exemplo, para um campo GENRES, seus dados de um item podem ser Action|Crime|Biopic. Se você tiver vários níveis de dados categóricos e alguns itens tiverem várias categorias para cada nível na hierarquia, adicione um campo para cada nível e acrescente um indicador de nível após cada nome de campo: GENRES, GENRE_L2, GENRE_L3. Isso permite filtrar recomendações com base em subcategorias, mesmo que um item pertença a várias categorias de vários níveis. Por exemplo, um vídeo pode ter os seguintes dados para cada nível de categoria:

  • GENRES: Ação|Aventura

  • GENRE_L2: Crime|Faroeste

  • GENRE_L3: biografia

Neste exemplo, o vídeo está na hierarquia ação > crime > biografia e na hierarquia aventura > faroeste > biografia. Recomendamos usar apenas até L3, mas você pode usar mais níveis, se necessário. Para mais informações sobre como criar e usar filtros, consulte Como filtrar recomendações e segmentos de usuários.

Esquema de itens padrão (domínio VIDEO_ON_DEMAND)

Veja a seguir o esquema padrão para conjuntos de dados de itens para o domínio VIDEO_ON_DEMAND.

{ "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" } ], "version": "1.0" }