選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

尋找並填入資料集中遺失的值

焦點模式
尋找並填入資料集中遺失的值 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

您可以使用 FillMissingValues 轉換以尋找遺失值的資料集中的記錄,並新增具有由插補決定值的新欄位。輸入資料集用於訓練機器學習 (ML) 模型,以決定遺失值應該是什麼。如果您使用增量資料集,則會使用每個增量集作為 ML 模型的訓練資料,因此結果可能不會那麼準確。

在任務圖表中使用 FillMissingValues 轉換節點
  1. (選用) 根據需要開啟資源面板,然後選擇 FillMissingValues,將新轉換新增至您的任務圖表。

  2. Node properties (節點屬性) 索引標籤上,輸入任務圖表中節點的名稱。如果尚未選取節點父項,請從節點父項清單選擇用作轉換之輸入來源的節點。

  3. 選擇轉換索引標籤。

  4. 對於資料欄位,從您要分析遺失值的來源資料中選擇欄或欄位名稱。

  5. (選用) 在新增欄位名稱欄位中,輸入新增至每筆記錄的欄位名稱,該欄位將保留已分析欄位的估計取代值。如果已分析的欄位沒有遺失值,則分析欄位中的值會複製到新欄位中。

    如果未指定新欄位的名稱,則預設名稱是已分析欄位的名稱,附加上 _filled。例如,如果您為資料欄位輸入 Age,並且不指定新欄位名稱的值,則會將名為 Age_filled 的新欄位新增至每個記錄。

  6. (選用) 設定轉換節點屬性之後,您可以選擇節點詳細資訊面板中的輸出結構描述索引標籤來檢視資料的修改後結構描述。當您第一次針對任務中的任何節點選擇此索引標籤時,系統會提示您提供 IAM 角色以存取資料。如果您尚未在任務詳細資訊索引標籤上指定 IAM 角色,系統會提示您在此輸入 IAM 角色。

  7. (選用) 設定節點屬性和轉換屬性之後,您可以選擇節點詳細資訊面板中的資料預覽索引標籤來預覽修改後的資料集。當您第一次針對任務中的任何節點選擇此索引標籤時,系統會提示您提供 IAM 角色以存取資料。使用此功能需支付相關費用,並且在您提供 IAM 角色後立即開始計費。

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。