Explorar dados usando técnicas de visualização - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Explorar dados usando técnicas de visualização

nota

Você só pode usar visualizações do SageMaker Canvas para modelos criados em conjuntos de dados tabulares. Modelos de previsão de texto de várias categorias também são excluídos.

Com o Amazon SageMaker Canvas, você pode explorar e visualizar seus dados para obter insights avançados sobre seus dados antes de criar seus modelos de ML. Você pode visualizar usando gráficos de dispersão, gráficos de barras e gráficos de caixa, que podem ajudá-lo a entender seus dados e descobrir as relações entre os atributos que podem afetar a precisão do modelo.

Na guia Criar do aplicativo SageMaker Canvas, escolha Visualizador de dados para começar a criar suas visualizações.

Você pode alterar o tamanho da amostra de visualização para ajustar o tamanho da amostra aleatória retirada do seu conjunto de dados. Um tamanho de amostra muito grande pode afetar o desempenho das suas visualizações de dados, por isso recomendamos que você escolha um tamanho de amostra adequado. Para alterar o tamanho da amostra, use o procedimento a seguir.

  1. Escolha Amostra de visualização.

  2. Use o controle deslizante para selecionar o tamanho de amostra desejado.

  3. Escolha Atualizar para confirmar a alteração no tamanho da amostra.

nota

Certas técnicas de visualização exigem colunas de um tipo de dados específico. Por exemplo, você só pode usar colunas numéricas para os eixos x e y dos gráficos de dispersão.

Gráfico de dispersão

Para criar um gráfico de dispersão com seu conjunto de dados, escolha Gráfico de dispersão no painel de Visualização. Escolha as feições que você deseja traçar nos eixos x e y na seção Colunas. Você pode arrastar e soltar as colunas nos eixos ou, depois que um eixo for solto, você pode escolher uma coluna na lista de colunas suportadas.

Você pode usar Colorir por para colorir os pontos de dados no gráfico com um terceiro atributo. Você também pode usar Agrupar por para agrupar os dados em gráficos separados com base em um quarto atributo.

A imagem a seguir mostra um gráfico de dispersão que usa Colorir por e Agrupar por. Neste exemplo, cada ponto de dados é colorido pelo atributo MaritalStatus, e o agrupamento pelo atributo Department resulta em um gráfico de dispersão para os pontos de dados de cada departamento.

Captura de tela de um gráfico de dispersão na visualização do Visualizador de dados do aplicativo Canvas.

Gráfico de barras

Para criar um gráfico de barras com seu conjunto de dados, escolha Gráfico de barras no painel de Visualização. Escolha as feições que você deseja traçar nos eixos x e y na seção Colunas. Você pode arrastar e soltar as colunas nos eixos ou, depois que um eixo for solto, você pode escolher uma coluna na lista de colunas suportadas.

Você pode usar Agrupar por para agrupar o gráfico de barras por um terceiro atributo. Você pode usar Empilhar por para sombrear verticalmente cada barra com base nos valores exclusivos de um quarto atributo.

A imagem a seguir mostra um gráfico de barras que usa Agrupar por e Empilhar por. Neste exemplo, o gráfico de barras é agrupado pelo atributo MaritalStatus e empilhado pelo atributo JobLevel. Para cada JobRole no eixo x, há uma barra separada para as categorias exclusivas no atributo MaritalStatus, e cada barra é empilhada verticalmente pelo atributo JobLevel.

Captura de tela de um gráfico de barras na visualização do Visualizador de dados do aplicativo Canvas.

Gráfico de caixa

Para criar um gráfico de caixa com seu conjunto de dados, escolha Gráfico de caixa no painel de Visualização. Escolha as feições que você deseja traçar nos eixos x e y na seção Colunas. Você pode arrastar e soltar as colunas nos eixos ou, depois que um eixo for solto, você pode escolher uma coluna na lista de colunas suportadas.

Você pode usar Agrupar por para agrupar os gráficos de caixa por um terceiro atributo.

A imagem a seguir mostra um gráfico de caixa que usa Agrupar por. Neste exemplo, os eixos x e y mostram JobLevel eJobSatisfaction, respectivamente, e os gráficos de caixa coloridos são agrupados pelo atributo Department.

Captura de tela de um gráfico de caixa na visualização do Visualizador de dados do aplicativo Canvas.