Notas da versão - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Notas da versão

O Data Wrangler é atualizado regularmente com novos atributos e correções de bugs. Para atualizar a versão do Data Wrangler que você está usando no Studio Classic, siga as instruções em Encerrar e atualizar o Studio Classic e as aplicações.

Notas da versão

31/08/2023

Nova função:

Agora você pode criar um relatório de qualidade dos dados e insights em todo o seu conjunto de dados. Para obter mais informações, consulte Obtenha insights sobre dados e qualidade dos dados.

20/05/2023

Nova função:

Agora você pode importar seus dados do Salesforce Data Cloud. Para obter mais informações, consulte Importar dados do Salesforce Data Cloud.

18/04/2023

Nova função:

Agora você pode obter seus dados em um formato que o Amazon Personalize possa interpretar. Para obter mais informações, consulte Colunas de mapas do Amazon Personalize.

01/03/2023

Nova função:

Agora você pode usar o Hive para importar seus dados do Amazon EMR. Para obter mais informações, consulte Importar dados do Amazon EMR.

10/12/2022

Nova função:

Agora você pode exportar seu fluxo do Data Wrangler para um endpoint de inferência. Para obter mais informações, consulte Exportar para um endpoint de inferência.

Nova função:

Agora você pode usar um widget de caderno interativo para a preparação de dados. Para obter mais informações, consulte Use um widget interativo de preparação de dados em um notebook Amazon SageMaker Studio Classic para obter insights de dados.

Nova função:

Agora você pode importar dados de plataformas SaaS. Para obter mais informações, consulte Importar dados de plataformas de software como serviço (SaaS).

12/10/2022

Nova função:

Agora você pode reutilizar fluxos de dados para conjuntos de dados diferentes. Para obter mais informações, consulte Reutilização de fluxos de dados para diferentes conjuntos de dados.

10/05/2022

Nova função:

Agora você pode usar a Análise de Componentes Principais (PCA) como uma transformação. Para obter mais informações, consulte Reduza a dimensionalidade em um conjunto de dados.

10/05/2022

Nova função:

Agora você pode reajustar os parâmetros em seu fluxo do Data Wrangler. Para obter mais informações, consulte Exportar.

10/03/2022

Nova função:

Agora você pode implantar modelos a partir do seu fluxo do Data Wrangler. Para obter mais informações, consulte Treine modelos automaticamente em seu fluxo de dados.

20/09/2022

Nova função:

Agora você pode configurar períodos de retenção de dados no Athena. Para obter mais informações, consulte Importar dados do Athena.

09/06/2022

Nova função:

Agora você pode usar o Amazon SageMaker Autopilot para treinar um modelo diretamente do seu fluxo do Data Wrangler. Para obter mais informações, consulte Treine modelos automaticamente em seu fluxo de dados.

6/5/2022

Nova função:

Agora você pode usar instâncias m5 e r5 adicionais. Para obter mais informações, consulte Instâncias.

27/04/2022

Novas funcionalidades:

01/04/2022

Nova função:

Agora você pode usar o Databricks como fonte de dados. Para obter mais informações, consulte Importar dados do Databricks (JDBC).

2/2/2022

Novas funcionalidades:

  • Agora você pode exportar usando nós de destino. Para ter mais informações, consulte Exportar

  • Você pode importar arquivos ORC e JSON. Para obter mais informações sobre tipos de arquivos, consulte Importar.

  • O Data Wrangler agora oferece apoio ao uso da transformação SMOTE. Para obter mais informações, consulte Dados da balança.

  • O Data Wrangler agora oferece apoio à codificação de similaridade para dados categóricos. Para obter mais informações, consulte Codificação de similaridade.

  • O Data Wrangler agora oferece apoio ao desaninhamento de dados JSON. Para obter mais informações, consulte Desaninhar dados JSON.

  • O Data Wrangler agora oferece apoio à expansão dos valores de uma matriz em colunas separadas. Para obter mais informações, consulte Explodir matriz.

  • O Data Wrangler agora oferece apoio para entrar em contato com a equipe de serviço quando você tiver problemas. Para obter mais informações, consulte Solução de problemas.

  • O Data Wrangler oferece apoio a etapas de edição e exclusão em seu fluxo de dados. Para ter mais informações, consulte Excluir uma etapa do seu fluxo de dados e Exclua uma etapa no seu fluxo do Data Wrangler..

  • Agora você pode executar transformações em várias colunas. Para obter mais informações, consulte Transformar dados.

  • Agora, o Data Wrangler oferece apoio para tags de alocação de custos Para obter mais informações, consulte Usar tags de alocação de custos.

16/10/2021

Nova função:

O Data Wrangler agora oferece apoio aos grupos de trabalho do Athena. Para obter mais informações, consulte Importar dados do Athena.

6/10/2021

Nova função:

O Data Wrangler agora oferece apoio à transformação de dados de séries temporais. Para obter mais informações, consulte Séries temporais de transformações.

15/07/2021

Novas funcionalidades:

  • Não há compatibilidade com Snowflake e Data Wrangler. Você pode usar o Snowflake como fonte de dados no Data Wrangler.

  • Foi adicionada compatibilidade com delimitador de campo personalizado em CSV. Agora há compatibilidade com vírgula, dois pontos, ponto e vírgula, barra vertical (|) e Tab.

  • Agora você pode exportar resultados diretamente para o Amazon S3.

  • Foram adicionados alguns novos analisadores de multicolinearidade: fatores de inflação de variação, análise de componentes principais e seleção de atributos Lasso.

Aprimoramentos:

  • Os gráficos de análise não podem mais ser embalados com rótulos sobrepostos.

Correções de bugs:

  • O codificador One-Hot processa a string vazia com elegância.

  • Correção de falhas que ocorriam quando o nome de uma coluna de dataframe continha pontos.

26/04/2021

Aprimoramentos:

  • Foi adicionada compatibilidade com trabalhos de processamento distribuído. Você pode usar várias instâncias ao executar um trabalho de processamento.

  • O trabalho de processamento do Data Wrangler agora aglutina automaticamente pequenas saídas quando o tamanho estimado do resultado é menor que 1 gigabyte.

  • Caderno de arquivo de atributos: desempenho aprimorado de ingestão do arquivo de atributos

  • Os trabalhos de processamento do Data Wrangler agora usam 1.x como a tag de contêiner autorizada para futuras liberações.

Correções de bugs:

  • Problemas de renderização corrigidos para histograma facetado.

  • Reparo no Exportar para Trabalho de Processamento para compatibilidade com colunas de tipo vetorial.

  • Reparto do operador Extract using regex para retornar o primeiro grupo capturado se um ou mais existirem na expressão regular ou regex.

08/02/2021

Novas funcionalidades:

  • O Data Wrangler Flows oferece apoio a várias instâncias.

  • Exportação atualizada para o Data Wrangler Job Notebook para usar o SageMaker SDK 2.20.0.

  • O Export to Pipeline Notebook foi atualizado para usar o SageMaker SDK 2.20.0.

  • O Export to Pipeline Notebook foi atualizado para adicionar um exemplo de XGBoost treinamento como uma etapa opcional.

Aprimoramentos:

  • Para melhorar o desempenho, a importação de arquivos CSV que contêm várias linhas em um único campo não é mais compatível.

Correções de bugs:

  • Corrigido o problema de inferência de tipo no modelo Quick.

  • Corrigido o bug da métrica de desvio nos relatórios de desvio.

  • Corrigida a transformação de texto Featurize para trabalhar com colunas com valores ausentes.

  • Corrigidas as visualizações integradas de histograma fixo e gráfico de dispersão para trabalhar com conjuntos de dados que contêm colunas semelhantes a matrizes.

  • A consulta Athena agora é executada novamente se a ID de execução da consulta tiver expirado.