Notas da versão

O Data Wrangler é atualizado regularmente com novos atributos e correções de bugs. Para atualizar a versão do Data Wrangler que você está usando no Studio Classic, siga as instruções em Encerre e atualize os aplicativos do Amazon SageMaker Studio Classic.

Notas da versão

Notas da versão
8/31/2023 Nova função: Agora você pode criar um relatório de qualidade dos dados e insights em todo o seu conjunto de dados. Para obter mais informações, consulte Obtenha insights sobre dados e qualidade dos dados. 5/20/2023 Nova função: Agora você pode importar seus dados do Salesforce Data Cloud. Para obter mais informações, consulte Importar dados do Salesforce Data Cloud. 4/18/2023 Nova função: Agora você pode obter seus dados em um formato que o Amazon Personalize possa interpretar. Para obter mais informações, consulte Colunas de mapas do Amazon Personalize. 3/1/2023 Nova função: Agora você pode usar o Hive para importar seus dados do Amazon EMR. Para obter mais informações, consulte Importar dados do Amazon EMR. 12/10/2022 Nova função: Agora você pode exportar seu fluxo do Data Wrangler para um endpoint de inferência. Para obter mais informações, consulte Exportar para um endpoint de inferência. Nova função: Agora você pode usar um widget de caderno interativo para a preparação de dados. Para obter mais informações, consulte Use um widget interativo de preparação de dados em um notebook Amazon SageMaker Studio Classic para obter insights de dados. Nova função: Agora você pode importar dados de plataformas SaaS. Para obter mais informações, consulte Importar dados de plataformas de software como serviço (SaaS). 10/12/2022 Nova função: Agora você pode reutilizar fluxos de dados para conjuntos de dados diferentes. Para obter mais informações, consulte Reutilização de fluxos de dados para diferentes conjuntos de dados. 10/05/2022 Nova função: Agora você pode usar a Análise de Componentes Principais (PCA) como uma transformação. Para obter mais informações, consulte Reduza a dimensionalidade em um conjunto de dados. 10/05/2022 Nova função: Agora você pode reajustar os parâmetros em seu fluxo do Data Wrangler. Para obter mais informações, consulte Exportar. 10/03/2022 Nova função: Agora você pode implantar modelos a partir do seu fluxo do Data Wrangler. Para obter mais informações, consulte Treine modelos automaticamente em seu fluxo de dados. 9/20/2022 Nova função: Agora você pode configurar períodos de retenção de dados no Athena. Para obter mais informações, consulte Importar dados do Athena. 6/9/2022 Nova função: Agora você pode usar o Amazon SageMaker Autopilot para treinar um modelo diretamente do seu fluxo do Data Wrangler. Para obter mais informações, consulte Treine modelos automaticamente em seu fluxo de dados. 5/6/2022 Nova função: Agora você pode usar instâncias m5 e r5 adicionais. Para obter mais informações, consulte Instâncias. 4/27/2022 Novas funcionalidades: Agora você pode obter um relatório de qualidade de dados. Para obter mais informações, consulte Obtenha insights sobre dados e qualidade dos dados. Agora você pode realizar amostragem aleatória e amostragem estratificada. Para obter mais informações, consulte Amostragem. 4/1/2022 Nova função: Agora você pode usar o Databricks como fonte de dados. Para obter mais informações, consulte Importar dados do Databricks (JDBC). 2/2/2022 Novas funcionalidades: Agora você pode exportar usando nós de destino. Para obter mais informações, consulte Exportar. Você pode importar arquivos ORC e JSON. Para obter mais informações sobre tipos de arquivos, consulte Importar. O Data Wrangler agora oferece apoio ao uso da transformação SMOTE. Para obter mais informações, consulte Dados da balança. O Data Wrangler agora oferece apoio à codificação de similaridade para dados categóricos. Para obter mais informações, consulte Codificação de similaridade. O Data Wrangler agora oferece apoio ao desaninhamento de dados JSON. Para obter mais informações, consulte Desaninhar dados JSON. O Data Wrangler agora oferece apoio à expansão dos valores de uma matriz em colunas separadas. Para obter mais informações, consulte Explodir matriz. O Data Wrangler agora oferece apoio para entrar em contato com a equipe de serviço quando você tiver problemas. Para obter mais informações, consulte Solução de problemas. O Data Wrangler oferece apoio a etapas de edição e exclusão em seu fluxo de dados. Para obter mais informações, consulte Excluir uma etapa do seu fluxo de dados e Exclua uma etapa no seu fluxo do Data Wrangler.. Agora você pode executar transformações em várias colunas. Para obter mais informações, consulte Transformar dados. Agora, o Data Wrangler oferece apoio para tags de alocação de custos Para obter mais informações, consulte Usar tags de alocação de custos. 10/16/2021 Nova função: O Data Wrangler agora oferece apoio aos grupos de trabalho do Athena. Para obter mais informações, consulte Importar dados do Athena. 10/6/2021 Nova função: O Data Wrangler agora oferece apoio à transformação de dados de séries temporais. Para obter mais informações, consulte Séries temporais de transformações. 7/15/2021 Novas funcionalidades: Não há compatibilidade com Snowflake e Data Wrangler. Você pode usar o Snowflake como fonte de dados no Data Wrangler. Foi adicionada compatibilidade com delimitador de campo personalizado em CSV. Agora há compatibilidade com vírgula, dois pontos, ponto e vírgula, barra vertical (\|) e Tab. Agora você pode exportar resultados diretamente para o Amazon S3. Foram adicionados alguns novos analisadores de multicolinearidade: fatores de inflação de variação, análise de componentes principais e seleção de atributos Lasso. Aprimoramentos: Os gráficos de análise não podem mais ser embalados com rótulos sobrepostos. Correções de bugs: One-hot o codificador manipula a string vazia com elegância. Correção de falhas que ocorriam quando o nome de uma coluna de dataframe continha pontos. 4/26/2021 Melhorias: Foi adicionada compatibilidade com trabalhos de processamento distribuído. Você pode usar várias instâncias ao executar um trabalho de processamento. O trabalho de processamento do Data Wrangler agora aglutina automaticamente pequenas saídas quando o tamanho estimado do resultado é menor que 1 gigabyte. Caderno de arquivo de atributos: desempenho aprimorado de ingestão do arquivo de atributos Os trabalhos de processamento do Data Wrangler agora usam 1.x como a tag de contêiner autorizada para futuras liberações. Correções de bugs: Problemas de renderização corrigidos para histograma facetado. Reparo no Exportar para Trabalho de Processamento para compatibilidade com colunas de tipo vetorial. Reparto do operador `Extract using regex` para retornar o primeiro grupo capturado se um ou mais existirem na expressão regular ou regex. 2/8/2021 Novas funcionalidades: O Data Wrangler Flows oferece apoio a várias instâncias. Exportação atualizada para o Data Wrangler Job Notebook para usar o SageMaker SDK 2.20.0. O Export to Pipeline Notebook foi atualizado para usar o SageMaker SDK 2.20.0. Atualização da função Exportar para o Caderno Pipeline atualizado para adicionar o exemplo de treinamento do XGBoost como uma etapa opcional. Aprimoramentos: Para melhorar o desempenho, a importação de arquivos CSV que contêm várias linhas em um único campo não é mais compatível. Correções de bugs: Corrigido o problema de inferência de tipo no modelo Quick. Corrigido o bug da métrica de desvio nos relatórios de desvio. Corrigida a transformação de texto Featurize para trabalhar com colunas com valores ausentes. Corrigidas as visualizações integradas de histograma fixo e gráfico de dispersão para trabalhar com conjuntos de dados que contêm colunas semelhantes a matrizes. A consulta Athena agora é executada novamente se a ID de execução da consulta tiver expirado.

8/31/2023

Nova função:

Agora você pode criar um relatório de qualidade dos dados e insights em todo o seu conjunto de dados. Para obter mais informações, consulte Obtenha insights sobre dados e qualidade dos dados.

5/20/2023

Nova função:

Agora você pode importar seus dados do Salesforce Data Cloud. Para obter mais informações, consulte Importar dados do Salesforce Data Cloud.

4/18/2023

Nova função:

Agora você pode obter seus dados em um formato que o Amazon Personalize possa interpretar. Para obter mais informações, consulte Colunas de mapas do Amazon Personalize.

3/1/2023

Nova função:

Agora você pode usar o Hive para importar seus dados do Amazon EMR. Para obter mais informações, consulte Importar dados do Amazon EMR.

12/10/2022

Nova função:

Agora você pode exportar seu fluxo do Data Wrangler para um endpoint de inferência. Para obter mais informações, consulte Exportar para um endpoint de inferência.

Nova função:

Agora você pode usar um widget de caderno interativo para a preparação de dados. Para obter mais informações, consulte Use um widget interativo de preparação de dados em um notebook Amazon SageMaker Studio Classic para obter insights de dados.

Nova função:

Agora você pode importar dados de plataformas SaaS. Para obter mais informações, consulte Importar dados de plataformas de software como serviço (SaaS).

10/12/2022

Nova função:

Agora você pode reutilizar fluxos de dados para conjuntos de dados diferentes. Para obter mais informações, consulte Reutilização de fluxos de dados para diferentes conjuntos de dados.

10/05/2022

Nova função:

Agora você pode usar a Análise de Componentes Principais (PCA) como uma transformação. Para obter mais informações, consulte Reduza a dimensionalidade em um conjunto de dados.

10/05/2022

Nova função:

Agora você pode reajustar os parâmetros em seu fluxo do Data Wrangler. Para obter mais informações, consulte Exportar.

10/03/2022

Nova função:

Agora você pode implantar modelos a partir do seu fluxo do Data Wrangler. Para obter mais informações, consulte Treine modelos automaticamente em seu fluxo de dados.

9/20/2022

Nova função:

Agora você pode configurar períodos de retenção de dados no Athena. Para obter mais informações, consulte Importar dados do Athena.

6/9/2022

Nova função:

Agora você pode usar o Amazon SageMaker Autopilot para treinar um modelo diretamente do seu fluxo do Data Wrangler. Para obter mais informações, consulte Treine modelos automaticamente em seu fluxo de dados.

5/6/2022

Nova função:

Agora você pode usar instâncias m5 e r5 adicionais. Para obter mais informações, consulte Instâncias.

4/27/2022

Novas funcionalidades:

Agora você pode obter um relatório de qualidade de dados. Para obter mais informações, consulte Obtenha insights sobre dados e qualidade dos dados.
Agora você pode realizar amostragem aleatória e amostragem estratificada. Para obter mais informações, consulte Amostragem.

4/1/2022

Nova função:

Agora você pode usar o Databricks como fonte de dados. Para obter mais informações, consulte Importar dados do Databricks (JDBC).

2/2/2022

Novas funcionalidades:

Agora você pode exportar usando nós de destino. Para obter mais informações, consulte Exportar.
Você pode importar arquivos ORC e JSON. Para obter mais informações sobre tipos de arquivos, consulte Importar.
O Data Wrangler agora oferece apoio ao uso da transformação SMOTE. Para obter mais informações, consulte Dados da balança.
O Data Wrangler agora oferece apoio à codificação de similaridade para dados categóricos. Para obter mais informações, consulte Codificação de similaridade.
O Data Wrangler agora oferece apoio ao desaninhamento de dados JSON. Para obter mais informações, consulte Desaninhar dados JSON.
O Data Wrangler agora oferece apoio à expansão dos valores de uma matriz em colunas separadas. Para obter mais informações, consulte Explodir matriz.
O Data Wrangler agora oferece apoio para entrar em contato com a equipe de serviço quando você tiver problemas. Para obter mais informações, consulte Solução de problemas.
O Data Wrangler oferece apoio a etapas de edição e exclusão em seu fluxo de dados. Para obter mais informações, consulte Excluir uma etapa do seu fluxo de dados e Exclua uma etapa no seu fluxo do Data Wrangler..
Agora você pode executar transformações em várias colunas. Para obter mais informações, consulte Transformar dados.
Agora, o Data Wrangler oferece apoio para tags de alocação de custos Para obter mais informações, consulte Usar tags de alocação de custos.

10/16/2021

Nova função:

O Data Wrangler agora oferece apoio aos grupos de trabalho do Athena. Para obter mais informações, consulte Importar dados do Athena.

10/6/2021

Nova função:

O Data Wrangler agora oferece apoio à transformação de dados de séries temporais. Para obter mais informações, consulte Séries temporais de transformações.

7/15/2021

Novas funcionalidades:

Não há compatibilidade com Snowflake e Data Wrangler. Você pode usar o Snowflake como fonte de dados no Data Wrangler.
Foi adicionada compatibilidade com delimitador de campo personalizado em CSV. Agora há compatibilidade com vírgula, dois pontos, ponto e vírgula, barra vertical (|) e Tab.
Agora você pode exportar resultados diretamente para o Amazon S3.
Foram adicionados alguns novos analisadores de multicolinearidade: fatores de inflação de variação, análise de componentes principais e seleção de atributos Lasso.

Aprimoramentos:

Os gráficos de análise não podem mais ser embalados com rótulos sobrepostos.

Correções de bugs:

One-hot o codificador manipula a string vazia com elegância.
Correção de falhas que ocorriam quando o nome de uma coluna de dataframe continha pontos.

4/26/2021

Melhorias:

Foi adicionada compatibilidade com trabalhos de processamento distribuído. Você pode usar várias instâncias ao executar um trabalho de processamento.
O trabalho de processamento do Data Wrangler agora aglutina automaticamente pequenas saídas quando o tamanho estimado do resultado é menor que 1 gigabyte.
Caderno de arquivo de atributos: desempenho aprimorado de ingestão do arquivo de atributos
Os trabalhos de processamento do Data Wrangler agora usam 1.x como a tag de contêiner autorizada para futuras liberações.

Correções de bugs:

Problemas de renderização corrigidos para histograma facetado.
Reparo no Exportar para Trabalho de Processamento para compatibilidade com colunas de tipo vetorial.
Reparto do operador Extract using regex para retornar o primeiro grupo capturado se um ou mais existirem na expressão regular ou regex.

2/8/2021

Novas funcionalidades:

O Data Wrangler Flows oferece apoio a várias instâncias.
Exportação atualizada para o Data Wrangler Job Notebook para usar o SageMaker SDK 2.20.0.
O Export to Pipeline Notebook foi atualizado para usar o SageMaker SDK 2.20.0.
Atualização da função Exportar para o Caderno Pipeline atualizado para adicionar o exemplo de treinamento do XGBoost como uma etapa opcional.

Aprimoramentos:

Para melhorar o desempenho, a importação de arquivos CSV que contêm várias linhas em um único campo não é mais compatível.

Correções de bugs:

Corrigido o problema de inferência de tipo no modelo Quick.
Corrigido o bug da métrica de desvio nos relatórios de desvio.
Corrigida a transformação de texto Featurize para trabalhar com colunas com valores ausentes.
Corrigidas as visualizações integradas de histograma fixo e gráfico de dispersão para trabalhar com conjuntos de dados que contêm colunas semelhantes a matrizes.
A consulta Athena agora é executada novamente se a ID de execução da consulta tiver expirado.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Segurança e permissões

Solução de problemas