Note di rilascio

Data Wrangler viene aggiornato regolarmente con nuove funzioni e correzioni di errori. Per aggiornare la versione di Data Wrangler che stai utilizzando in Studio Classic, segui le istruzioni riportate in Chiudi e aggiorna le app Amazon SageMaker Studio Classic.

Note di rilascio

Note di rilascio
8/31/2023 Nuova funzionalità: Ora puoi creare un report Qualità dei dati e approfondimenti sull'intero set di dati. Per ulteriori informazioni, consulta Ottieni dettagli sui dati e sulla loro qualità. 5/20/2023 Nuova funzionalità: Ora puoi importare i tuoi dati da Salesforce Data Cloud. Per ulteriori informazioni, consulta Importare dati da Salesforce Data Cloud. 4/18/2023 Nuova funzionalità: Ora puoi ottenere i tuoi dati in un formato interpretabile da Amazon Personalize. Per ulteriori informazioni, consulta Colonne della mappa per Amazon Personalize. 3/1/2023 Nuova funzionalità: Ora puoi usare Hive per importare i tuoi dati da Amazon EMR. Per ulteriori informazioni, consulta Importazione di dati da Amazon EMR. 12/10/2022 Nuova funzionalità: Ora puoi esportare il flusso di Data Wrangler su un endpoint di inferenza. Per ulteriori informazioni, consulta Esportazione in un endpoint di inferenza. Nuova funzionalità: Ora puoi utilizzare un widget interattivo per notebook per la preparazione dei dati. Per ulteriori informazioni, consulta Usa un widget interattivo per la preparazione dei dati in un notebook Amazon SageMaker Studio Classic per ottenere informazioni dettagliate sui dati. Nuova funzionalità: Ora puoi importare dati da piattaforme SaaS. Per ulteriori informazioni, consulta Importare dati da piattaforme Software as a Service (SaaS). 10/12/2022 Nuova funzionalità: Ora puoi riutilizzare i flussi di dati per diversi set di dati. Per ulteriori informazioni, consulta Riutilizzo dei flussi di dati per set di dati diversi. 10/05/2022 Nuova funzionalità: È ora possibile utilizzare Principal Component Analysis (PCA) come trasformazione. Per ulteriori informazioni, consulta Ridurre la dimensionalità all'interno di un set di dati. 10/05/2022 Nuova funzionalità: Ora puoi modificare i parametri nel flusso di Data Wrangler. Per ulteriori informazioni, consulta Esportazione. 10/03/2022 Nuova funzionalità: Ora puoi distribuire modelli dal tuo flusso Data Wrangler. Per ulteriori informazioni, consulta Addestra automaticamente i modelli sul tuo flusso di dati. 9/20/2022 Nuova funzionalità: Ora puoi impostare i periodi di conservazione dei dati in Athena. Per ulteriori informazioni, consulta Importazione dei dati da Athena. 6/9/2022 Nuova funzionalità: Ora puoi usare Amazon SageMaker Autopilot per addestrare un modello direttamente dal tuo flusso Data Wrangler. Per ulteriori informazioni, consulta Addestra automaticamente i modelli sul tuo flusso di dati. 5/6/2022 Nuova funzionalità: Ora puoi usare istanze m5 e r5 aggiuntive. Per ulteriori informazioni, consulta Istanze. 4/27/2022 Nuova funzionalità Ora, è possibile ottenere un rapporto sulla qualità dei dati. Per ulteriori informazioni, consulta Ottieni dettagli sui dati e sulla loro qualità È ora possibile eseguire campionamenti casuali e campionamenti stratificati. Per ulteriori informazioni, consulta Campionamento. 4/1/2022 Nuova funzionalità: Ora puoi usare Databricks come origine dati. Per ulteriori informazioni, consulta Importazione di dati da Databricks (JDBC). 2/2/2022 Nuova funzionalità Ora puoi esportare utilizzando i nodi di destinazione. Per ulteriori informazioni, consulta Esportazione Puoi importare i file ORC e JSON. Per ulteriori informazioni sui tipi di file, consulta Importa. Data Wrangler ora supporta l'utilizzo della trasformazione SMOTE. Per ulteriori informazioni, consulta Bilanciamento dei dati. Data Wrangler ora supporta la codifica di similarità per i dati categorici. Per ulteriori informazioni, consulta Codifica di similarità. Data Wrangler ora supporta la cancellazione dei dati JSON. Per ulteriori informazioni, consulta Unnest dei dati JSON. Data Wrangler ora supporta l'espansione dei valori di un array in colonne separate. Per ulteriori informazioni, consulta Esplodi array. Data Wrangler ora supporta la possibilità di contattare il team di assistenza in caso di problemi. Per ulteriori informazioni, consulta Risoluzione dei problemi. Data Wrangler supporta la modifica e l'eliminazione delle fasi del flusso di dati. Per ulteriori informazioni, consultare Eliminare una fase dal flusso di dati e Modificare una fase del flusso di Data Wrangler. Ora, è possibile eseguire trasformazioni su più colonne. Per ulteriori informazioni, consulta Trasformazione dei dati. Data Wrangler ora supporta i tag dell'allocazione dei costi Per ulteriori informazioni, consulta Utilizzo dei tag per l'allocazione dei costi. 10/16/2021 Nuova funzionalità: Data Wrangler ora supporta i gruppi di lavoro Athena. Per ulteriori informazioni, consulta Importazione dei dati da Athena. 10/6/2021 Nuova funzionalità: Data Wrangler ora supporta la trasformazione dei dati delle serie temporali. Per ulteriori informazioni, consulta Serie temporale di trasformazione. 7/15/2021 Nuova funzionalità Snowflake e Data Wrangler è ora supportato. Puoi usare Snowflake come fonte di dati in Data Wrangler. È stato aggiunto il supporto per il delimitatore di campo personalizzato in CSV. Ora sono supportati virgola, colon, punto e virgola, pipe (\|) e Tab. Ora, è possibile esportare i risultati direttamente in Amazon S3. Aggiunti alcuni nuovi analizzatori di multicollinearità: fattori di inflazione della varianza, analisi delle componenti principali e selezione delle funzionalità Lasso. Miglioramenti: I grafici di analisi non possono più essere imballati con etichette sovrapposte. Correzioni di bug: One-hot l'encoder gestisce con garbo le stringhe vuote. Sono stati corretti gli arresti anomali che si verificavano quando il nome di una colonna dataframe conteneva punti. 4/26/2021 Miglioramenti: È stato aggiunto il supporto per i lavori di elaborazione distribuiti. È possibile utilizzare più istanze durante l'esecuzione di un processo di elaborazione. Il processo di elaborazione Data Wrangler ora unisce automaticamente piccoli output quando la dimensione stimata del risultato è inferiore a 1 gigabyte. Feature Store Notebook: prestazioni di acquisizione dei feature store migliorate I processi di Data Wrangler Processing ora utilizzano 1.x come tag container autorevole per le versioni future. Correzioni di bug: Risolti i problemi di rendering per l'istogramma sfaccettato. Risolto il problema con l'esportazione nel processo di elaborazione per supportare le colonne di tipo vettoriale. Risolto il problema con l’operatore `Extract using regex` per restituire il primo gruppo acquisito se ne esistono uno o più nell'espressione regolare o nell'espressione regolare. 2/8/2021 Nuova funzionalità: Data Wrangler Flows supporta più istanze. Aggiornamento dell'esportazione su Data Wrangler Job Notebook per utilizzare SageMaker SDK 2.20.0. Esportazione aggiornata su Pipeline Notebook per utilizzare SDK 2.20.0. SageMaker Esportazione aggiornata su Pipeline Notebook per aggiungere un esempio di addestramento XGBoost come fase opzionale. Miglioramenti: Per migliorare le prestazioni, l'importazione di file CSV che contengono più righe in un unico campo non è più supportata. Correzioni di bug: È stato risolto il problema di inferenza dei tipi nel modello Quick. È stato corretto il bug relativo alla metrica dei bias nei report sulle distorsioni. È stata corretta la trasformazione della caratterizzazione del testo per funzionare con colonne con valori mancanti. Risolte le visualizzazioni integrate di istogramma e grafico a dispersione per funzionare con set di dati che contengono colonne di tipo array. La query Athena ora viene eseguita nuovamente se l'ID di esecuzione della query è scaduto.

8/31/2023

Nuova funzionalità:

Ora puoi creare un report Qualità dei dati e approfondimenti sull'intero set di dati. Per ulteriori informazioni, consulta Ottieni dettagli sui dati e sulla loro qualità.

5/20/2023

Nuova funzionalità:

Ora puoi importare i tuoi dati da Salesforce Data Cloud. Per ulteriori informazioni, consulta Importare dati da Salesforce Data Cloud.

4/18/2023

Nuova funzionalità:

Ora puoi ottenere i tuoi dati in un formato interpretabile da Amazon Personalize. Per ulteriori informazioni, consulta Colonne della mappa per Amazon Personalize.

3/1/2023

Nuova funzionalità:

Ora puoi usare Hive per importare i tuoi dati da Amazon EMR. Per ulteriori informazioni, consulta Importazione di dati da Amazon EMR.

12/10/2022

Nuova funzionalità:

Ora puoi esportare il flusso di Data Wrangler su un endpoint di inferenza. Per ulteriori informazioni, consulta Esportazione in un endpoint di inferenza.

Nuova funzionalità:

Ora puoi utilizzare un widget interattivo per notebook per la preparazione dei dati. Per ulteriori informazioni, consulta Usa un widget interattivo per la preparazione dei dati in un notebook Amazon SageMaker Studio Classic per ottenere informazioni dettagliate sui dati.

Nuova funzionalità:

Ora puoi importare dati da piattaforme SaaS. Per ulteriori informazioni, consulta Importare dati da piattaforme Software as a Service (SaaS).

10/12/2022

Nuova funzionalità:

Ora puoi riutilizzare i flussi di dati per diversi set di dati. Per ulteriori informazioni, consulta Riutilizzo dei flussi di dati per set di dati diversi.

10/05/2022

Nuova funzionalità:

È ora possibile utilizzare Principal Component Analysis (PCA) come trasformazione. Per ulteriori informazioni, consulta Ridurre la dimensionalità all'interno di un set di dati.

10/05/2022

Nuova funzionalità:

Ora puoi modificare i parametri nel flusso di Data Wrangler. Per ulteriori informazioni, consulta Esportazione.

10/03/2022

Nuova funzionalità:

Ora puoi distribuire modelli dal tuo flusso Data Wrangler. Per ulteriori informazioni, consulta Addestra automaticamente i modelli sul tuo flusso di dati.

9/20/2022

Nuova funzionalità:

Ora puoi impostare i periodi di conservazione dei dati in Athena. Per ulteriori informazioni, consulta Importazione dei dati da Athena.

6/9/2022

Nuova funzionalità:

Ora puoi usare Amazon SageMaker Autopilot per addestrare un modello direttamente dal tuo flusso Data Wrangler. Per ulteriori informazioni, consulta Addestra automaticamente i modelli sul tuo flusso di dati.

5/6/2022

Nuova funzionalità:

Ora puoi usare istanze m5 e r5 aggiuntive. Per ulteriori informazioni, consulta Istanze.

4/27/2022

Nuova funzionalità

Ora, è possibile ottenere un rapporto sulla qualità dei dati. Per ulteriori informazioni, consulta Ottieni dettagli sui dati e sulla loro qualità
È ora possibile eseguire campionamenti casuali e campionamenti stratificati. Per ulteriori informazioni, consulta Campionamento.

4/1/2022

Nuova funzionalità:

Ora puoi usare Databricks come origine dati. Per ulteriori informazioni, consulta Importazione di dati da Databricks (JDBC).

2/2/2022

Nuova funzionalità

Ora puoi esportare utilizzando i nodi di destinazione. Per ulteriori informazioni, consulta Esportazione
Puoi importare i file ORC e JSON. Per ulteriori informazioni sui tipi di file, consulta Importa.
Data Wrangler ora supporta l'utilizzo della trasformazione SMOTE. Per ulteriori informazioni, consulta Bilanciamento dei dati.
Data Wrangler ora supporta la codifica di similarità per i dati categorici. Per ulteriori informazioni, consulta Codifica di similarità.
Data Wrangler ora supporta la cancellazione dei dati JSON. Per ulteriori informazioni, consulta Unnest dei dati JSON.
Data Wrangler ora supporta l'espansione dei valori di un array in colonne separate. Per ulteriori informazioni, consulta Esplodi array.
Data Wrangler ora supporta la possibilità di contattare il team di assistenza in caso di problemi. Per ulteriori informazioni, consulta Risoluzione dei problemi.
Data Wrangler supporta la modifica e l'eliminazione delle fasi del flusso di dati. Per ulteriori informazioni, consultare Eliminare una fase dal flusso di dati e Modificare una fase del flusso di Data Wrangler.
Ora, è possibile eseguire trasformazioni su più colonne. Per ulteriori informazioni, consulta Trasformazione dei dati.
Data Wrangler ora supporta i tag dell'allocazione dei costi Per ulteriori informazioni, consulta Utilizzo dei tag per l'allocazione dei costi.

10/16/2021

Nuova funzionalità:

Data Wrangler ora supporta i gruppi di lavoro Athena. Per ulteriori informazioni, consulta Importazione dei dati da Athena.

10/6/2021

Nuova funzionalità:

Data Wrangler ora supporta la trasformazione dei dati delle serie temporali. Per ulteriori informazioni, consulta Serie temporale di trasformazione.

7/15/2021

Nuova funzionalità

Snowflake e Data Wrangler è ora supportato. Puoi usare Snowflake come fonte di dati in Data Wrangler.
È stato aggiunto il supporto per il delimitatore di campo personalizzato in CSV. Ora sono supportati virgola, colon, punto e virgola, pipe (|) e Tab.
Ora, è possibile esportare i risultati direttamente in Amazon S3.
Aggiunti alcuni nuovi analizzatori di multicollinearità: fattori di inflazione della varianza, analisi delle componenti principali e selezione delle funzionalità Lasso.

Miglioramenti:

I grafici di analisi non possono più essere imballati con etichette sovrapposte.

Correzioni di bug:

One-hot l'encoder gestisce con garbo le stringhe vuote.
Sono stati corretti gli arresti anomali che si verificavano quando il nome di una colonna dataframe conteneva punti.

4/26/2021

Miglioramenti:

È stato aggiunto il supporto per i lavori di elaborazione distribuiti. È possibile utilizzare più istanze durante l'esecuzione di un processo di elaborazione.
Il processo di elaborazione Data Wrangler ora unisce automaticamente piccoli output quando la dimensione stimata del risultato è inferiore a 1 gigabyte.
Feature Store Notebook: prestazioni di acquisizione dei feature store migliorate
I processi di Data Wrangler Processing ora utilizzano 1.x come tag container autorevole per le versioni future.

Correzioni di bug:

Risolti i problemi di rendering per l'istogramma sfaccettato.
Risolto il problema con l'esportazione nel processo di elaborazione per supportare le colonne di tipo vettoriale.
Risolto il problema con l’operatore Extract using regex per restituire il primo gruppo acquisito se ne esistono uno o più nell'espressione regolare o nell'espressione regolare.

2/8/2021

Nuova funzionalità:

Data Wrangler Flows supporta più istanze.
Aggiornamento dell'esportazione su Data Wrangler Job Notebook per utilizzare SageMaker SDK 2.20.0.
Esportazione aggiornata su Pipeline Notebook per utilizzare SDK 2.20.0. SageMaker
Esportazione aggiornata su Pipeline Notebook per aggiungere un esempio di addestramento XGBoost come fase opzionale.

Miglioramenti:

Per migliorare le prestazioni, l'importazione di file CSV che contengono più righe in un unico campo non è più supportata.

Correzioni di bug:

È stato risolto il problema di inferenza dei tipi nel modello Quick.
È stato corretto il bug relativo alla metrica dei bias nei report sulle distorsioni.
È stata corretta la trasformazione della caratterizzazione del testo per funzionare con colonne con valori mancanti.
Risolte le visualizzazioni integrate di istogramma e grafico a dispersione per funzionare con set di dati che contengono colonne di tipo array.
La query Athena ora viene eseguita nuovamente se l'ID di esecuzione della query è scaduto.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Sicurezza e autorizzazioni

Risoluzione dei problemi