本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
您可以使用 FillMissingValues 轉換以尋找遺失值的資料集中的記錄,並新增具有由插補決定值的新欄位。輸入資料集用於訓練機器學習 (ML) 模型,以決定遺失值應該是什麼。如果您使用增量資料集,則會使用每個增量集作為 ML 模型的訓練資料,因此結果可能不會那麼準確。
在任務圖表中使用 FillMissingValues 轉換節點
-
(選用) 根據需要開啟資源面板,然後選擇 FillMissingValues,將新轉換新增至您的任務圖表。
-
在 Node properties (節點屬性) 索引標籤上,輸入任務圖表中節點的名稱。如果尚未選取節點父項,請從節點父項清單選擇用作轉換之輸入來源的節點。
-
選擇轉換索引標籤。
-
對於資料欄位,從您要分析遺失值的來源資料中選擇欄或欄位名稱。
-
(選用) 在新增欄位名稱欄位中,輸入新增至每筆記錄的欄位名稱,該欄位將保留已分析欄位的估計取代值。如果已分析的欄位沒有遺失值,則分析欄位中的值會複製到新欄位中。
如果未指定新欄位的名稱,則預設名稱是已分析欄位的名稱,附加上
_filled
。例如,如果您為資料欄位輸入Age
,並且不指定新欄位名稱的值,則會將名為Age_filled
的新欄位新增至每個記錄。 (選用) 設定轉換節點屬性之後,您可以選擇節點詳細資訊面板中的輸出結構描述索引標籤來檢視資料的修改後結構描述。當您第一次針對任務中的任何節點選擇此索引標籤時,系統會提示您提供 IAM 角色以存取資料。如果您尚未在任務詳細資訊索引標籤上指定 IAM 角色,系統會提示您在此輸入 IAM 角色。
(選用) 設定節點屬性和轉換屬性之後,您可以選擇節點詳細資訊面板中的資料預覽索引標籤來預覽修改後的資料集。當您第一次針對任務中的任何節點選擇此索引標籤時,系統會提示您提供 IAM 角色以存取資料。使用此功能需支付相關費用,並且在您提供 IAM 角色後立即開始計費。