本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
轉換資料
若要在 Data Wrangler 中轉換資料,您可以將轉換步驟新增至資料流程。Data Wrangler 包含超過 300 個可用於準備資料的轉換,包括 Amazon Personalize 轉換的映射資料欄。您也可以使用一般 Data Wrangler 轉換來修正異常值、類型問題和遺失值等問題。
完成資料轉換後,您可以使用 Data Wrangler 分析資料。或者,如果您已完成在 Data Wrangler 中準備資料,您可以處理資料並將其匯入 Amazon Personalize。如需分析資料的資訊,請參閱 產生視覺化效果和資料洞見。如需處理和匯入資料的資訊,請參閱 處理資料並將其匯入 Amazon Personalize。
Amazon Personalize 的映射資料欄
若要轉換資料以符合 Amazon Personalize 需求,您可以新增 Amazon Personalize 轉換的映射資料欄,並將資料欄映射至 Amazon Personalize 的必要和選用欄位。
使用 Amazon Personalize 轉換的映射資料欄
-
選擇 + 做為最新的轉換,然後選擇新增轉換。如果您尚未新增轉換,請選擇資料類型轉換的 +。Data Wrangler 會自動將此轉換新增至您的流程。
-
選擇新增步驟。
-
選擇 Amazon Personalize 的轉換。預設會選取 Amazon Personalize 轉換的映射資料欄。
-
使用轉換欄位將您的資料映射至必要的 Amazon Personalize 屬性。
-
選擇符合您資料的資料集類型 (互動、項目或使用者)。
-
選擇您的網域 (ECOMMERCE、VIDEO_ON_ DEMAND或自訂)。您選擇的網域必須與您在建立資料集群組時指定的網域相符。
-
選擇符合 Amazon Personalize 必要和選用欄位的資料欄。例如,針對 item_ID 資料欄,選擇資料中存放每個項目唯一識別資訊的資料欄。
每個資料欄欄位都會依資料類型篩選。只有您資料中符合 Amazon Personalize 資料類型需求的資料欄可用。如果您的資料不是必要的類型,您可以使用剖析值做為類型 Data Wrangler 轉換來轉換它。
-
一般資料 Wrangler 轉換
下列一般 Data Wrangler 轉換可協助您準備 Amazon Personalize 的資料:
-
資料類型轉換:如果您的欄位未列在 Amazon Personalize 轉換的映射資料欄中,您可能需要轉換其資料類型。Data Wrangler 將剖析值轉換為類型,可協助您轉換資料。或者,您可以在建立流程時,使用 Data Wrangler 預設新增的資料類型轉換。若要使用此轉換,請從類型下拉式清單中選擇資料類型,選擇預覽,然後選擇更新。
如需欄位所需資料類型的資訊,請參閱 中網域和資料集類型的一節為 Amazon Personalize 結構描述建立結構描述JSON檔案。
-
處理遺失值和極端值:如果您產生遺失值或極端值洞見,您可以使用 Data Wrangler 轉換處理極端值和處理遺失值來解決這些問題。
-
自訂轉換:使用 Data Wrangler,您可以使用 Python (使用者定義的函數) PySpark、Pandas 或 PySpark () 建立自己的轉換SQL。您可以使用自訂轉換來執行任務,例如捨棄重複的資料欄或依資料欄分組。如需詳細資訊,請參閱《Amazon SageMaker AI 開發人員指南》中的自訂轉換。