版本備註 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

版本備註

Data Wrangler 會定期更新新功能和錯誤修正。若要升級您在 Studio Classic 中使用的 Data Wrangler 版本,請遵循 中的指示關閉並更新 Studio Classic 應用程式

版本備註

8/31/2023

新功能:

您現在可以針對整個資料集建立資料品質和深入分析的報告。如需詳細資訊,請參閱取得有關資料和資料品質的洞察

5/20/2023

新功能:

您現在可以從 Salesforce 資料雲端匯入您的資料。如需詳細資訊,請參閱從 Salesforce 資料雲端匯入資料。

4/18/2023

新功能:

您現在可以取得 Amazon Personalize 可以解譯之格式的資料。如需詳細資訊,請參閱Amazon Personalize 的地圖資料欄

3/1/2023

新功能:

您現在可以使用 Hive 從 Amazon 匯入資料EMR。如需詳細資訊,請參閱從 Amazon 匯入資料 EMR

12/10/2022

新功能:

您現在可以將 Data Wrangler 流程匯出到推論端點。如需詳細資訊,請參閱匯出至推論端點

新功能:

您現在可以使用互動式筆記本小工具來準備資料。如需詳細資訊,請參閱在 Amazon SageMaker Studio Classic 筆記本中使用互動式資料準備小工具,以取得 Data Insights

新功能:

您現在可以從 SaaS 平台匯入資料。如需詳細資訊,請參閱從軟體即服務 (SaaS) 平台匯入資料

10/12/2022

新功能:

您現在可以重複使用適用於不同的資料集的資料流程。如需詳細資訊,請參閱重複使用不同資料集的資料流量

10/05/2022

新功能:

您現在可以使用主體元件分析 (PCA) 作為轉換。如需詳細資訊,請參閱降低資料集內的維度

10/05/2022

新功能:

您現在可以重新擬合 Data Wrangler 流程中的參數。如需詳細資訊,請參閱匯出

10/03/2022

新功能:

您現在可以部署 Data Wrangler 流程的模型。如需詳細資訊,請參閱在資料流程上自動訓練模型

9/20/2022

新功能:

您現在可以在 Athena 設定資料保留期。如需詳細資訊,請參閱從 Athena 匯入資料

6/9/2022

新功能:

您現在可以使用 Amazon SageMaker Autopilot,直接從 Data Wrangler 流程訓練模型。如需詳細資訊,請參閱在資料流程上自動訓練模型

5/6/2022

新功能:

您現在可以使用額外的 m5 和 r5 執行個體。如需詳細資訊,請參閱執行個體

4/27/2022

新功能:

4/1/2022

新功能:

您現在可以使用 Databricks 做為資料來源。如需詳細資訊,請參閱從 Databricks 匯入資料 (JDBC)

2/2/2022

新功能:

  • 您現在可以使用目的地節點進行匯出。如需詳細資訊,請參閱 匯出

  • 您可以匯入 ORC和 JSON 檔案。如需檔案類型的詳細資訊,請參閱匯入

  • Data Wrangler 現在支援使用SMOTE轉換。如需詳細資訊,請參閱平衡資料

  • Data Wrangler 現在可支援適用於分類資料的相似性編碼。如需詳細資訊,請參閱相似性編碼

  • Data Wrangler 現在支援不巢狀JSON資料。如需詳細資訊,請參閱Unnest JSON 資料

  • Data Wrangler 現在可支援將陣列的值擴充至分隔的資料欄。如需詳細資訊,請參閱爆炸陣列

  • 在您遇到問題時,Data Wrangler 可立即支援與服務團隊聯絡。如需詳細資訊,請參閱疑難排解

  • Data Wrangler 可支援編輯和刪除資料流程中的步驟。如需詳細資訊,請參閱 從資料流量中刪除步驟編輯 Data Wrangler 流程中的步驟

  • 您現在可以在多個資料欄上執行轉換。如需詳細資訊,請參閱轉換資料

  • Data Wrangler 現在可支援成本分配標籤。如需詳細資訊,請參閱使用成本分配標籤

10/16/2021

新功能:

Data Wrangler 現在可支援 Athena 工作群組。如需詳細資訊,請參閱從 Athena 匯入資料

10/6/2021

新功能:

Data Wrangler 現在可支援轉換時間序列資料。如需詳細資訊,請參閱轉換時間序列

7/15/2021

新功能:

  • 現在可支援Snowflake 和 Data Wrangler。您可以使用 Snowflake 做為 Data Wrangler 中的資料來源。

  • 在 中新增了對自訂欄位分隔符號的支援CSV。現在逗號、冒號,分號、豎線 (|) 和索引標籤均受支援。

  • 您現在可以將結果直接匯出到 Amazon S3。

  • 已增加一些新的多重共線性分析器:變異數膨脹係數、主體元件分析和套索功能選擇。

增強功能:

  • 分析圖表再也不能使用重疊的標籤進行封裝。

錯誤修正:

  • One-hot 編碼器可優雅地處理空字串。

  • 已修正在資料框欄位名稱包含點時發生的當機。

4/26/2021

增強功能:

  • 已新增分散式處理任務的支援。您可以在執行處理工作時使用多個執行個體。

  • Data Wrangler Processing 任務現在會在預估結果大小小於 1 GB 時自動聯合小型輸出。

  • Feature Store 筆記本:改善 Feature Store 的擷取效能

  • Data Wrangler Processing 任務現在使用 1.x 版做為未來發行版本的權威容器標籤。

錯誤修正:

  • 已修正多面向長條圖的轉譯問題。

  • 已修正匯出至 Processing 任務,可支援向量類型欄。

  • 已修正在規則表達式或 regex 中存在一個或多個要傳回第一個擷取群組的 Extract using regex 運算子。

2/8/2021

新功能:

  • Data Wrangler 流程可支援多個執行個體。

  • 更新匯出至 Data Wrangler 任務筆記本以使用 SageMaker SDK 2.20.0。

  • 更新匯出至管道筆記本以使用 SageMaker SDK 2.20.0。

  • 更新匯出至管道筆記本,將XGBoost訓練範例新增為選用步驟。

增強功能:

  • 為了改善效能,不再支援匯入單一欄位中包含多行CSV的檔案。

錯誤修正:

  • 已修正 Quick 模型中的類型推斷問題。

  • 已修正偏差報告中的偏差指標錯誤。

  • 已修正特徵化文字轉換功能,可處理具有缺少值的資料欄。

  • 已修正長條圖和散佈圖內建視覺化,可處理包含類似陣列之資料欄的資料集。

  • 如果查詢執行 ID 已過期,則 Athena 查詢會立即重新執行。