As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Requisitos do esquema de conjunto de dados de interações com itens (personalizado)
Um conjunto de dados de interações com itens armazena dados históricos e em tempo real das interações entre usuários e itens no catálogo. Para obter informações sobre os tipos de dados de interações que o Amazon Personalize pode usar, consulte Dados de interações com itens.
Os dados que você fornece para cada interação devem corresponder ao seu esquema. Dependendo do seu esquema, os metadados de interação podem incluir valores vazios/nulos. No mínimo, você deve fornecer o seguinte para cada interação:
-
ID de usuário
-
ID do Item
-
Carimbo de data e hora (no formato de hora Unix epoch)
Você pode adicionar outros campos, dependendo do seu caso de uso e dos seus dados. Desde que os campos não estejam listados como obrigatórios ou reservados e os tipos de dados estejam listados em Tipos de dados do esquema, é você quem escolhe os nomes e tipos de dados dos campos.
O número total máximo de campos de metadados opcionais que podem ser adicionados a um conjunto de dados de interações com itens, combinado com o número total de tipos de eventos distintos nos dados de interações com itens, é dez. Os campos de metadados incluídos nessa contagem são campos EVENT _TYPE, EVENT _ junto com quaisquer VALUE campos de metadados personalizados que você adicionar ao seu esquema. O número máximo de campos de metadados excluindo campos reservados, comoIMPRESSION, é 5. Os valores categóricos podem ter no máximo 1.000 caracteres. Se você tiver uma interação com um valor categórico acima de mil, sua tarefa de importação do conjunto de dados falhará.
Para obter mais informações sobre requisitos mínimos e limites máximos de dados para um conjunto de dados de interações com itens, consulte Cotas de serviço.
Exemplo de esquema de interações (personalizado)
O exemplo a seguir mostra um esquema de conjunto de dados de interações com itens. Os campos USER_ID
, ITEM_ID
e TIMESTAMP
são obrigatórios. Os campos EVENT_TYPE
, EVENT_VALUE
e IMPRESSION
são palavras-chave reservadas opcionais reconhecidas pelo Amazon Personalize. EVENT_ TYPE deve ser do tipo string e não pode ser categórico. LOCATION
e DEVICE
são campos de metadados contextuais opcionais. Para obter informações sobre requisitos do esquema, consulte Requisitos de conjuntos de dados personalizados e esquemas.
{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "EVENT_TYPE", "type": "string" }, { "name": "EVENT_VALUE", "type": [ "float", "null" ] }, { "name": "LOCATION", "type": "string", "categorical": true }, { "name": "DEVICE", "type": [ "string", "null" ], "categorical": true }, { "name": "TIMESTAMP", "type": "long" }, { "name": "IMPRESSION", "type": "string" } ], "version": "1.0" }
Para esse esquema, as primeiras linhas de dados históricos em um CSV arquivo podem ter a seguinte aparência. Observe que alguns valores para EVENT _ VALUE são nulos.
USER_ID,ITEM_ID,EVENT_TYPE,EVENT_VALUE,LOCATION,DEVICE,TIMESTAMP,IMPRESSION 35,73,click,,Ohio,Tablet,1586731606,73|70|17|95|96|92|55|45|16|97|56|54|33|94|36|10|5|43|19|13|51|90|65|59|38 54,35,watch,0.75,Indiana,Cellphone,1586735164,35|82|78|57|20|63|1|90|76|75|49|71|26|24|25|6|37|85|40|98|32|13|11|54|48 9,33,click,,Oregon,Cellphone,1586735158,68|33|62|6|15|57|45|24|78|89|90|40|26|91|66|31|47|17|99|29|27|41|77|75|14 23,10,watch,0.25,California,Tablet,1586735697,92|89|36|10|39|77|4|27|79|18|83|16|28|68|78|40|50|3|99|7|87|49|12|57|53 27,11,watch,0.55,Indiana,Tablet,1586735763,11|7|39|95|71|1|6|40|41|28|99|53|68|76|0|65|69|36|22|42|34|67|24|20|66 ... ...