Note di rilascio - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Note di rilascio

Data Wrangler viene aggiornato regolarmente con nuove funzioni e correzioni di errori. Per aggiornare la versione di Data Wrangler che stai utilizzando in Studio Classic, segui le istruzioni riportate in. Chiudi e aggiorna le app Studio Classic

Note di rilascio

31/08/2023

Nuova funzionalità:

Ora puoi creare un report Qualità dei dati e approfondimenti sull'intero set di dati. Per ulteriori informazioni, consulta Ottieni dettagli sui dati e sulla loro qualità.

20/05/2023

Nuova funzionalità:

Ora puoi importare i tuoi dati da Salesforce Data Cloud. Per ulteriori informazioni, consulta Importare dati da Salesforce Data Cloud.

18/04/2023

Nuova funzionalità:

Ora puoi ottenere i tuoi dati in un formato interpretabile da Amazon Personalize. Per ulteriori informazioni, consulta Colonne della mappa per Amazon Personalize.

01/03/2023

Nuova funzionalità:

Ora puoi usare Hive per importare i tuoi dati da AmazonEMR. Per ulteriori informazioni, consulta Importa dati da Amazon EMR.

10/12/2022

Nuova funzionalità:

Ora puoi esportare il flusso di Data Wrangler su un endpoint di inferenza. Per ulteriori informazioni, consulta Esportazione in un endpoint di inferenza.

Nuova funzionalità:

Ora puoi utilizzare un widget interattivo per notebook per la preparazione dei dati. Per ulteriori informazioni, consulta Usa un widget interattivo per la preparazione dei dati in un notebook Amazon SageMaker Studio Classic per ottenere informazioni dettagliate sui dati.

Nuova funzionalità:

Ora puoi importare dati da piattaforme SaaS. Per ulteriori informazioni, consulta Importare dati da piattaforme Software as a Service (SaaS).

10/12/2022

Nuova funzionalità:

Ora puoi riutilizzare i flussi di dati per diversi set di dati. Per ulteriori informazioni, consulta Riutilizzo dei flussi di dati per set di dati diversi.

10/05/2022

Nuova funzionalità:

Ora puoi usare Principal Component Analysis (PCA) come trasformazione. Per ulteriori informazioni, consulta Ridurre la dimensionalità all'interno di un set di dati.

10/05/2022

Nuova funzionalità:

Ora puoi modificare i parametri nel flusso di Data Wrangler. Per ulteriori informazioni, consulta Esporta.

10/03/2022

Nuova funzionalità:

Ora puoi distribuire modelli dal tuo flusso Data Wrangler. Per ulteriori informazioni, consulta Addestra automaticamente i modelli sul tuo flusso di dati.

20/09/2022

Nuova funzionalità:

Ora puoi impostare i periodi di conservazione dei dati in Athena. Per ulteriori informazioni, consulta Importazione dei dati da Athena.

09/06/2022

Nuova funzionalità:

Ora puoi usare Amazon SageMaker Autopilot per addestrare un modello direttamente dal tuo flusso Data Wrangler. Per ulteriori informazioni, consulta Addestra automaticamente i modelli sul tuo flusso di dati.

06/05/2022

Nuova funzionalità:

Ora puoi usare istanze m5 e r5 aggiuntive. Per ulteriori informazioni, consulta Istanze.

27/4/2022

Nuova funzionalità

01/04/2022

Nuova funzionalità:

Ora puoi usare Databricks come origine dati. Per ulteriori informazioni, consulta Importa dati da Databricks () JDBC.

02/2/2022

Nuova funzionalità

  • Ora puoi esportare utilizzando i nodi di destinazione. Per ulteriori informazioni, consulta Esporta

  • Puoi importare file ORC e file. JSON Per ulteriori informazioni sui tipi di file, consulta Importa.

  • Data Wrangler ora supporta l'utilizzo della SMOTE trasformazione. Per ulteriori informazioni, consulta Bilanciamento dei dati.

  • Data Wrangler ora supporta la codifica di similarità per i dati categorici. Per ulteriori informazioni, consulta Codifica di similarità.

  • Data Wrangler ora supporta la cancellazione dei dati. JSON Per ulteriori informazioni, consulta Annulla dati JSON.

  • Data Wrangler ora supporta l'espansione dei valori di un array in colonne separate. Per ulteriori informazioni, consulta Esplodi array.

  • Data Wrangler ora supporta la possibilità di contattare il team di assistenza in caso di problemi. Per ulteriori informazioni, consulta Risoluzione dei problemi.

  • Data Wrangler supporta la modifica e l'eliminazione delle fasi del flusso di dati. Per ulteriori informazioni, consulta Eliminare una fase dal flusso di dati e Modificare una fase del flusso di Data Wrangler.

  • Ora, è possibile eseguire trasformazioni su più colonne. Per ulteriori informazioni, consulta Trasformazione dei dati.

  • Data Wrangler ora supporta i tag dell'allocazione dei costi Per ulteriori informazioni, consulta Utilizzo dei tag per l'allocazione dei costi.

16/10/2021

Nuova funzionalità:

Data Wrangler ora supporta i gruppi di lavoro Athena. Per ulteriori informazioni, consulta Importazione dei dati da Athena.

6/10/2021

Nuova funzionalità:

Data Wrangler ora supporta la trasformazione dei dati delle serie temporali. Per ulteriori informazioni, consulta Serie temporale di trasformazione.

15/07/2021

Nuova funzionalità

  • Snowflake e Data Wrangler è ora supportato. Puoi usare Snowflake come fonte di dati in Data Wrangler.

  • Aggiunto il supporto per il delimitatore di campo personalizzato in. CSV Ora sono supportati virgola, colon, punto e virgola, pipe (|) e Tab.

  • Ora, è possibile esportare i risultati direttamente in Amazon S3.

  • Aggiunti alcuni nuovi analizzatori di multicollinearità: fattori di inflazione della varianza, analisi delle componenti principali e selezione delle funzionalità Lasso.

Miglioramenti:

  • I grafici di analisi non possono più essere imballati con etichette sovrapposte.

Correzioni di bug:

  • L'encoder One-hot gestisce con garbo le stringhe vuote.

  • Sono stati corretti gli arresti anomali che si verificavano quando il nome di una colonna dataframe conteneva punti.

26/04/2021

Miglioramenti:

  • È stato aggiunto il supporto per i lavori di elaborazione distribuiti. È possibile utilizzare più istanze durante l'esecuzione di un processo di elaborazione.

  • Il processo di elaborazione Data Wrangler ora unisce automaticamente piccoli output quando la dimensione stimata del risultato è inferiore a 1 gigabyte.

  • Feature Store Notebook: prestazioni di acquisizione dei feature store migliorate

  • I processi di Data Wrangler Processing ora utilizzano 1.x come tag container autorevole per le versioni future.

Correzioni di bug:

  • Risolti i problemi di rendering per l'istogramma sfaccettato.

  • Risolto il problema con l'esportazione nel processo di elaborazione per supportare le colonne di tipo vettoriale.

  • Risolto il problema con l’operatore Extract using regex per restituire il primo gruppo acquisito se ne esistono uno o più nell'espressione regolare o nell'espressione regolare.

8/2/2021

Nuova funzionalità:

  • Data Wrangler Flows supporta più istanze.

  • Aggiornamento dell'esportazione su Data Wrangler Job Notebook per utilizzare SageMaker SDK la versione 2.20.0.

  • Esportazione aggiornata su Pipeline Notebook per utilizzare 2.20.0. SageMaker SDK

  • Esportazione aggiornata su Pipeline Notebook per aggiungere un esempio di XGBoost formazione come passaggio opzionale.

Miglioramenti:

  • Per migliorare le prestazioni, l'importazione di CSV file che contengono più righe in un unico campo non è più supportata.

Correzioni di bug:

  • È stato risolto il problema di inferenza dei tipi nel modello Quick.

  • È stato corretto il bug relativo alla metrica dei bias nei report sulle distorsioni.

  • È stata corretta la trasformazione della caratterizzazione del testo per funzionare con colonne con valori mancanti.

  • Risolte le visualizzazioni integrate di istogramma e grafico a dispersione per funzionare con set di dati che contengono colonne di tipo array.

  • La query Athena ora viene eseguita nuovamente se l'ID di esecuzione della query è scaduto.