Notas da versão - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Notas da versão

O Data Wrangler é atualizado regularmente com novos recursos e correções de bugs. Para atualizar a versão do Data Wrangler que você está usando no Studio Classic, siga as instruções em. Desligue e atualize os aplicativos do Studio Classic

Notas da versão

31/08/2023

Nova função:

Agora você pode criar um relatório de qualidade dos dados e insights em todo o seu conjunto de dados. Para obter mais informações, consulte Obtenha insights sobre dados e qualidade dos dados.

20/05/2023

Nova função:

Agora você pode importar seus dados do Salesforce Data Cloud. Para obter mais informações, consulte Importar dados do Salesforce Data Cloud.

18/04/2023

Nova função:

Agora você pode obter seus dados em um formato que o Amazon Personalize possa interpretar. Para obter mais informações, consulte Colunas de mapas do Amazon Personalize.

01/03/2023

Nova função:

Agora você pode usar o Hive para importar seus dados da AmazonEMR. Para obter mais informações, consulte Importar dados da Amazon EMR.

10/12/2022

Nova função:

Agora você pode exportar seu fluxo do Data Wrangler para um endpoint de inferência. Para obter mais informações, consulte Exportar para um endpoint de inferência.

Nova função:

Agora você pode usar um widget de caderno interativo para a preparação de dados. Para obter mais informações, consulte Use um widget interativo de preparação de dados em um notebook Amazon SageMaker Studio Classic para obter insights de dados.

Nova função:

Agora você pode importar dados de plataformas SaaS. Para obter mais informações, consulte Importar dados de plataformas de software como serviço (SaaS).

12/10/2022

Nova função:

Agora você pode reutilizar fluxos de dados para conjuntos de dados diferentes. Para obter mais informações, consulte Reutilização de fluxos de dados para diferentes conjuntos de dados.

10/05/2022

Nova função:

Agora você pode usar a Análise de Componentes Principais (PCA) como uma transformação. Para obter mais informações, consulte Reduza a dimensionalidade em um conjunto de dados.

10/05/2022

Nova função:

Agora você pode reajustar os parâmetros em seu fluxo do Data Wrangler. Para obter mais informações, consulte Export.

10/03/2022

Nova função:

Agora você pode implantar modelos a partir do seu fluxo do Data Wrangler. Para obter mais informações, consulte Treine modelos automaticamente em seu fluxo de dados.

20/09/2022

Nova função:

Agora você pode configurar períodos de retenção de dados no Athena. Para obter mais informações, consulte Importar dados do Athena.

09/06/2022

Nova função:

Agora você pode usar o Amazon SageMaker Autopilot para treinar um modelo diretamente do seu fluxo do Data Wrangler. Para obter mais informações, consulte Treine modelos automaticamente em seu fluxo de dados.

6/5/2022

Nova função:

Agora você pode usar instâncias m5 e r5 adicionais. Para obter mais informações, consulte Instâncias.

27/04/2022

Novas funcionalidades:

01/04/2022

Nova função:

Agora você pode usar o Databricks como fonte de dados. Para obter mais informações, consulte Importar dados do Databricks () JDBC.

2/2/2022

Novas funcionalidades:

  • Agora você pode exportar usando nós de destino. Para ter mais informações, consulte Export

  • Você pode importar ORC JSON arquivos. Para obter mais informações sobre tipos de arquivos, consulte Importar.

  • O Data Wrangler agora suporta o uso da SMOTE transformação. Para obter mais informações, consulte Dados da balança.

  • O Data Wrangler agora oferece suporte à codificação de similaridade para dados categóricos. Para obter mais informações, consulte Codificação de similaridade.

  • O Data Wrangler agora oferece suporte ao JSON desagrupamento de dados. Para obter mais informações, consulte Dados do Unnest JSON.

  • O Data Wrangler agora oferece suporte à expansão dos valores de uma matriz em colunas separadas. Para obter mais informações, consulte Explodir matriz.

  • O Data Wrangler agora oferece suporte para entrar em contato com a equipe de serviço quando você tiver problemas. Para obter mais informações, consulte Solução de problemas.

  • O Data Wrangler oferece suporte a etapas de edição e exclusão em seu fluxo de dados. Para ter mais informações, consulte Excluir uma etapa do seu fluxo de dados e Exclua uma etapa no seu fluxo do Data Wrangler..

  • Agora você pode executar transformações em várias colunas. Para obter mais informações, consulte Dados de transformação.

  • Agora, o Data Wrangler oferece suporte para tags de alocação de custos Para obter mais informações, consulte Usar tags de alocação de custos.

16/10/2021

Nova função:

O Data Wrangler agora oferece suporte aos grupos de trabalho do Athena. Para obter mais informações, consulte Importar dados do Athena.

6/10/2021

Nova função:

O Data Wrangler agora oferece suporte à transformação de dados de séries temporais. Para obter mais informações, consulte Séries temporais de transformações.

15/07/2021

Novas funções:

  • Não há suporte para Snowflake e Data Wrangler. Você pode usar o Snowflake como fonte de dados no Data Wrangler.

  • Foi adicionado suporte para delimitador de campo personalizado em. CSV Agora há suporte para vírgula, dois pontos, ponto e vírgula, barra vertical (|) e Tab.

  • Agora você pode exportar resultados diretamente para o Amazon S3.

  • Foram adicionados alguns novos analisadores de multicolinearidade: fatores de inflação de variação, análise de componentes principais e seleção de recursos Lasso.

Aprimoramentos:

  • Os gráficos de análise não podem mais ser embalados com rótulos sobrepostos.

Correções de bugs:

  • O codificador One-Hot processa a string vazia com elegância.

  • Correção de falhas que ocorriam quando o nome de uma coluna de dataframe continha pontos.

26/04/2021

Aprimoramentos:

  • Foi adicionado suporte para trabalhos de processamento distribuído. Você pode usar várias instâncias ao executar um trabalho de processamento.

  • O trabalho de processamento do Data Wrangler agora aglutina automaticamente pequenas saídas quando o tamanho estimado do resultado é menor que 1 gigabyte.

  • Caderno de arquivo de atributos: desempenho aprimorado de ingestão do arquivo de atributos

  • Os trabalhos de processamento do Data Wrangler agora usam 1.x como a tag de contêiner autorizada para futuras liberações.

Correções de bugs:

  • Problemas de renderização corrigidos para histograma facetado.

  • Reparo no Exportar para Trabalho de Processamento para suportar colunas de tipo vetorial.

  • Reparto do operador Extract using regex para retornar o primeiro grupo capturado se um ou mais existirem na expressão regular ou regex.

08/02/2021

Novas funções:

  • O Data Wrangler Flows oferece suporte a várias instâncias.

  • Export to Data Wrangler Job Notebook atualizado para usar SageMaker SDK a versão 2.20.0.

  • O Export to Pipeline Notebook foi atualizado para usar a SageMaker SDK versão 2.20.0.

  • O Export to Pipeline Notebook foi atualizado para adicionar um exemplo de XGBoost treinamento como uma etapa opcional.

Melhorias:

  • Para melhorar o desempenho, a importação de CSV arquivos que contêm várias linhas em um único campo não é mais suportada.

Correções de bugs:

  • Corrigido o problema de inferência de tipo no modelo Quick.

  • Corrigido o bug da métrica de viés nos relatórios de viés.

  • Corrigida a transformação de texto Featurize para trabalhar com colunas com valores ausentes.

  • Corrigidas as visualizações integradas de histograma fixo e gráfico de dispersão para trabalhar com conjuntos de dados que contêm colunas semelhantes a matrizes.

  • A consulta Athena agora é executada novamente se a ID de execução da consulta tiver expirado.