As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Geração de visualizações e insights de dados
Depois de importar seus dados para o Data Wrangler, você pode usá-los para gerar visualizações e insights de dados.
-
Visualizações: o Data Wrangler pode gerar diferentes tipos de gráficos, como histogramas e gráficos de dispersão. Por exemplo, você pode gerar um histograma para identificar discrepâncias nos dados.
-
Insights de dados: você pode usar um relatório de qualidade e insights de dados para o Amazon Personalize para aprender sobre seus dados por meio de insights de dados e estatísticas de colunas e linhas. Esse relatório pode informar se há algum tipo de problema em seus dados. E você pode saber quais ações tomar para melhorar seus dados. Essas ações podem ajudar você a atender aos requisitos de atributos do Amazon Personalize, como requisitos de treinamento de modelos, ou podem levar a recomendações aprimoradas.
Depois de aprender sobre seus dados por meio de visualizações e insights, você pode usar essas informações para aplicar transformações adicionais e melhorar seus dados. Ou, se você tiver concluído a preparação de seus dados, poderá processá-los e importá-los para o Amazon Personalize. Para obter informações sobre como transformar dados, consulte Transformação de dados. Para obter informações sobre processamento e importação de dados, consulte Processar dados e importá-los para o Amazon Personalize.
Gerar visualizações
Você pode usar o Data Wrangler para criar diferentes tipos de gráficos, como histogramas e gráficos de dispersão. Por exemplo, você pode gerar um histograma para identificar discrepâncias nos dados. Para gerar uma visualização de dados, você adiciona uma etapa de Análise ao seu fluxo e, em Tipo de análise, escolhe a visualização que deseja criar.
Para obter mais informações sobre a criação de visualizações no Data Wrangler, consulte Analyze and Visualize no Amazon Developer Guide. SageMaker
Gerar insights de dados
Você pode usar o Data Wrangler para gerar um relatório de qualidade de dados e insights para o Amazon Personalize específico para seu tipo de conjunto de dados. Antes de gerar o relatório, recomendamos que você transforme seus dados para atender aos requisitos do Amazon Personalize. Isso resultará em insights mais relevantes. Para obter mais informações, consulte Transformação de dados.
Conteúdo do relatório
O relatório de qualidade de dados e insights para o Amazon Personalize inclui as seguintes seções:
-
Resumo: o resumo do relatório inclui estatísticas do conjunto de dados e avisos de alta prioridade:
-
Estatísticas do conjunto de dados: incluem estatísticas específicas do Amazon Personalize, como o número de usuários exclusivos em seus dados de interações, e estatísticas gerais, como o número de valores ausentes ou valores discrepantes.
-
Avisos de alta prioridade: esses são insights específicos do Amazon Personalize que têm o maior impacto no treinamento ou nas recomendações. Cada aviso inclui uma ação recomendada que você pode tomar para resolver o problema.
-
-
Linhas duplicadas e linhas incompletas: essas seções incluem informações sobre quais linhas têm valores ausentes e quais linhas estão duplicadas em seus dados.
-
Resumo do atributo: esta seção inclui o tipo de dados de cada coluna, informações de dados inválidas ou ausentes e contagens de avisos.
-
Detalhes do atributo: esta seção inclui subseções com informações detalhadas para cada uma de suas colunas de dados. Cada subseção inclui estatísticas da coluna, como contagem de valores categóricos e informações de valores ausentes. E cada subseção inclui insights específicos do Amazon Personalize e ações recomendadas para colunas de dados. Por exemplo, um insight pode indicar que uma coluna tem mais de 30 categorias possíveis.
Problemas no tipo de dados
O relatório identifica colunas que não são do tipo de dados correto e especifica o tipo necessário. Para obter insights relacionados a esses atributos, você deve converter o tipo de dados da coluna e gerar o relatório novamente. Para converter o tipo, você pode usar a transformação Analisar valor como tipo do Data Wrangler.
Insights Amazon Personalize
Os insights do Amazon Personalize incluem uma descoberta e uma ação sugerida. A ação é opcional. Por exemplo, o relatório pode incluir um insight e uma ação relacionados ao número de categorias para uma coluna de dados categóricos. Se você não acredita que a coluna seja categórica, você pode ignorar esse insight e nenhuma ação é necessária.
Exceto por pequenas diferenças de escolha de palavras, os insights específicos do Amazon Personalize são os mesmos que os insights de um único conjunto de dados que você pode gerar ao analisar seus dados com o Amazon Personalize. Por exemplo, o relatório de insights no Data Wrangler inclui informações, como “O conjunto de dados de interações com itens tem apenas X usuários únicos com duas ou mais interações”. No entanto, ele não inclui insights, como “X% dos itens no conjunto de dados de itens não têm interações no conjunto de dados de interações com itens”.
Para obter uma lista de possíveis insights específicos do Amazon Personalize, consulte os insights que não fazem referência a vários conjuntos de dados no Insights de dados.
Exemplos de relatório
A aparência do relatório Amazon Personalize é a mesma do relatório de insights gerais no Data Wrangler. Para ver exemplos do relatório geral de insights, consulte Obtenha insights sobre dados e qualidade de dados no Amazon SageMaker Developer Guide. O exemplo a seguir mostra como funciona a seção de resumo de um relatório de um conjunto de dados de interações com itens. Ele inclui estatísticas do conjunto de dados e alguns possíveis avisos de alta prioridade do conjunto de dados de interações com itens.
O exemplo a seguir mostra como a seção de detalhes do recurso de uma TYPE coluna EVENT _ de um conjunto de dados de interações de itens pode aparecer em um relatório.
Gerar o relatório
Para gerar o relatório de qualidade de dados e insights para o Amazon Personalize, selecione Obter insights de dados para sua transformação e crie uma análise.
Para gerar um relatório de qualidade de dados e insights para o Amazon Personalize
-
Escolha a opção + para a transformação que você está analisando. Se você não tiver adicionado uma transformação, selecione o + para a transformação de Tipos de dados. O Data Wrangler adiciona essa transformação automaticamente ao seu fluxo.
-
Selecione Obter insights de dados. O painel Criar análise é exibido.
-
Para Tipo de análise, selecione Relatório de qualidade de dados e insights para o Amazon Personalize.
-
Para Tipo de conjunto de dados, escolha o tipo de conjunto de dados do Amazon Personalize que você está analisando.
-
Opcionalmente, selecione Executar com dados completos. Por padrão, o Data Wrangler gera insights sobre apenas uma amostra de seus dados.
-
Selecione Criar. Quando a análise for concluída, o relatório será exibido.