Transformação de dados - Amazon Personalize

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Transformação de dados

Para transformar dados no Data Wrangler, você adiciona uma etapa de Transformação ao seu fluxo de dados. O Data Wrangler inclui mais de 300 transformações que você pode usar para preparar seus dados, incluindo uma transformação Mapear colunas para o Amazon Personalize. E você pode usar as transformações gerais do Data Wrangler para corrigir problemas como valores discrepantes, problemas de tipo e valores ausentes.

Depois de concluir a transformação dos dados, você pode analisá-los com o Data Wrangler. Ou, se você terminar de preparar seus dados no Data Wrangler, poderá processá-los e importá-los para o Amazon Personalize. Para obter informações sobre a análise de dados, consulte Geração de visualizações e insights de dados. Para obter informações sobre processamento e importação de dados, consulte Processar dados e importá-los para o Amazon Personalize.

Mapear colunas para o Amazon Personalize

Para transformar seus dados para que eles atendam aos requisitos do Amazon Personalize, você adiciona a transformação Mapear colunas para a do Amazon Personalize e mapeia suas colunas para os campos obrigatórios e opcionais do Amazon Personalize.

Para usar a transformação Mapear colunas para a do Amazon Personalize
  1. Selecione + para sua última transformação e escolha Adicionar transformação. Se você não tiver adicionado uma transformação, selecione o + para a transformação de Tipos de dados. O Data Wrangler adiciona essa transformação automaticamente ao seu fluxo.

  2. Selecione Adicionar etapa.

  3. Selecione Transformações para o Amazon Personalize. A transformação Mapear colunas para o Amazon Personalize é selecionada por padrão.

  4. Use os campos de transformação para mapear seus dados de acordo com os atributos necessários do Amazon Personalize.

    1. Selecione o tipo de conjunto de dados que corresponde aos seus dados (interações, itens ou usuários).

    2. Escolha seu domínio (ECOMMERCE, VIDEO _ON_ DEMAND ou personalizado). O domínio selecionado deve corresponder ao domínio que você especificou ao criar seu grupo de conjuntos de dados.

    3. Escolha as colunas que correspondem aos campos obrigatórios e opcionais do Amazon Personalize. Por exemplo, para a coluna Item_ID, escolha a coluna em seus dados que armazena as informações de identificação exclusivas de cada um dos seus itens.

      Cada campo da coluna é filtrado por tipo de dados. Somente as colunas em seus dados que atendem aos requisitos de tipo de dados do Amazon Personalize ficam disponíveis. Se seus dados não forem do tipo necessário, você poderá usar a transformação Analisar valor como tipo do Data Wrangler para convertê-los.

Transformações gerais do Data Wrangler

As seguintes transformações gerais do Data Wrangler podem ajudar você a preparar dados para o Amazon Personalize:

  • Conversão do tipo de dados: se o seu campo não estiver listado como uma opção possível na transformação Mapear colunas para o Amazon Personalize, talvez seja necessário converter o tipo de dados. A transformação Analisar valor como tipo do Data Wrangler pode ajudar você a converter seus dados. Ou você pode usar a transformação Tipos de dados que o Data Wrangler adiciona por padrão ao criar um fluxo. Para usar essa transformação, escolha o tipo de dados nas listas suspensas Tipo, escolha Visualizar e, em seguida, selecione Atualizar.

    Para obter informações sobre os tipos de dados obrigatórios para campos, consulte a seção sobre seu domínio e tipo de conjunto de dados em Criação de JSON arquivos de esquema para esquemas do Amazon Personalize.

  • Tratamento de valores ausentes e valores discrepantes: se você gerar valores ausentes ou insights discrepantes, poderá usar as transformações do Data Wrangler para Tratar valores discrepantes e Tratar valores ausentes para resolver esses problemas.

  • Transformações personalizadas: com o Data Wrangler, você pode criar suas próprias transformações com Python (função definida pelo usuário) PySpark, pandas ou (). PySpark SQL Você pode usar uma transformação personalizada para realizar tarefas como eliminar colunas duplicadas ou agrupar por colunas. Para obter mais informações, consulte Transformações personalizadas no Amazon SageMaker Developer Guide.