Preparar e importar dados em massa - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Preparar e importar dados em massa

Depois de criar um conjunto de dados, é possível começar a importar os dados históricos em massa para o Amazon Personalize. Você tem duas opções para importar seus registros em massa:

  • Para interações de itens, usuários e conjuntos de dados de itens, você pode usar o Amazon SageMaker Data Wrangler para importar seus dados de mais de 40 fontes, gerar visualizações e insights específicos do Amazon Personalize e transformá-los para atender aos requisitos do Amazon Personalize.

  • Para todos os tipos de conjunto de dados, é possível importar dados em massa diretamente para conjuntos de dados. Ao importar diretamente, você formata manualmente seus dados para atender aos requisitos do Amazon Personalize e os carrega para o Amazon S3. Em seguida, você cria um esquema e um conjunto de dados e importa os dados diretamente para o conjunto de dados com um trabalho de importação do conjunto de dados.

As diretrizes a seguir podem ajudar a garantir que seus dados em massa sejam formatados corretamente.

  • Seus dados de entrada devem estar um arquivo CSV (valores separados por vírgula).

  • A primeira linha do seu arquivo CSV deve conter cabeçalhos de coluna. Não coloque cabeçalhos entre aspas (").

  • É preciso ter campos obrigatórios para seu tipo de conjunto de dados e garantir que os nomes estejam alinhados aos requisitos do Amazon Personalize. Por exemplo, seus dados de itens podem ter uma coluna chamada ITEM_IDENTIFICATION_NUMBER com IDs para cada um dos seus itens. Para usar essa coluna como um campo ITEM_ID, renomeie a coluna para ITEM_ID. Se você usa o Data Wrangler para formatar seus dados, você pode usar a transformação do Data Wrangler Mapear colunas para o Amazon Personalize para garantir que suas colunas sejam nomeadas corretamente.

    Para obter informações sobre campos obrigatórios, consulte Esquemas. Para obter informações sobre como usar o Data Wrangler para preparar seus dados, consulte Preparação e importação de dados usando o Amazon SageMaker Data Wrangler.

  • Os nomes dos cabeçalhos das colunas no seu arquivo CSV devem ser mapeados para seu esquema.

  • Cada registro no arquivo CSV deve estar em uma única linha.

  • Os tipos de dados em cada coluna devem ser mapeados para seu esquema. Se você usar o Data Wrangler para formatar seus dados, poderá usar a transformação do Data Wrangler Analisar valor como tipo para converter os tipos de dados.

  • Os dados TIMESTAMP e CREATION_TIMESTAMP devem estar no formato de tempo UNIX epoch. Para ter mais informações, consulte Dados de carimbo de data/hora.

  • Evite incluir " caracteres ou caracteres especiais nos dados de ID do item, ID do usuário e ID da ação.

  • Se os dados incluírem caracteres não codificados em ASCII, o arquivo CSV deverá ser codificado no formato UTF-8.

  • Formate todos os dados textuais conforme descrito em Metadados de texto não estruturados.

  • Certifique-se de formatar os dados de impressão e os dados categóricos conforme descrito em Como formatar impressões explícitas e Como formatar dados categóricos.

Para obter mais informações sobre os requisitos de formatação de dados em massa para o Amazon Personalize, consulte Diretrizes de formato de dados.

Depois de importar dados para um conjunto de dados do Amazon Personalize, você pode analisá-los, exportá-los para um bucket do Amazon S3, atualizá-los ou excluí-los removendo o conjunto de dados. Para ter mais informações, consulte Gerenciando os dados de treinamento em seus conjuntos de dados.

Se você já criou um recomendador ou implantou uma versão da solução personalizada com uma campanha, a forma como os novos registros em massa influenciam as recomendações depende do caso de uso de domínio ou da fórmula que você usa. Para ter mais informações, consulte Como os novos dados influenciam as recomendações em tempo real.

Filtrar atualizações para registros em massa

Em até 20 minutos após concluir uma importação em massa, o Amazon Personalize atualiza todos os filtros que você criou no grupo de conjuntos de dados com seu novo item e dados do usuário. Essa atualização permite que o Amazon Personalize use os dados mais recentes ao filtrar recomendações para seus usuários.