資料驗證 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料驗證

在建置模型之前,SageMaker Canvas 會檢查您的資料集,找出可能導致建置失敗的問題。如果 SageMaker Canvas 發現任何問題,它會在您嘗試建立模型之前在建置頁面上警告您。

您可以選擇驗證資料以查看資料集中的問題清單。然後,您可以使用 SageMaker Canvas Data Wrangler 資料準備功能或您自己的工具,在啟動建置之前修正資料集。如果您未修正資料集的問題,則建置將會失敗。

如果您變更資料集以修正問題,則可以選擇在嘗試建置之前重新驗證資料集。建議您在建置之前重新驗證資料集。

下表顯示 SageMaker Canvas 在您的資料集中檢查的問題,以及如何解決這些問題。

問題 Resolution

資料的模型類型錯誤

請嘗試其他模型類型或使用不同的資料集。

目標欄中缺少值

取代缺少值、刪除缺少值的資料列,或使用不同的資料集。

目標欄中有太多唯一標籤

確認您已為目標欄使用正確的資料欄,或使用不同的資料集。

目標欄中有太多非數值

選擇不同的目標欄、選取其他模型類型,或使用不同的資料集。

一個或多個資料欄名稱包含兩個底線

重新命名資料欄,移除任何兩個底線,然後再試一次。

資料集中的任何資料列都不完整

取代缺少值,或使用不同的資料集。

資料中的列數有太多唯一的標籤

檢查您使用的是正確的目標欄、增加資料集中的列數、合併類似的標籤,或使用不同的資料集。