產生視覺化效果和資料洞見 - Amazon Personalize

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

產生視覺化效果和資料洞見

將資料匯入 Data Wrangler 之後,您可以使用它來產生視覺化和資料洞見。

  • 視覺化:Data Wrangler 可以產生不同類型的圖形,例如長條圖和散佈圖。例如,您可以產生長條圖來識別資料中的極端值。

  • 資料洞見:您可以使用 Amazon Personalize 的資料品質和洞見報告,透過資料洞見和資料欄和資料列統計資料來了解您的資料。此報告可以讓您知道資料中是否有任何類型的問題。您也可以了解可以採取哪些動作來改善資料。這些動作可協助您滿足 Amazon Personalize 資源需求,例如模型訓練需求,或者可以改善建議。

透過視覺化和洞察了解資料之後,您可以使用此資訊來協助您套用其他轉換來改善資料。或者,如果您已完成準備資料,您可以處理資料並將其匯入 Amazon Personalize。如需轉換資料的相關資訊,請參閱 轉換資料。如需處理和匯入資料的資訊,請參閱處理資料並將其匯入 Amazon Personalize

產生視覺化效果

您可以使用 Data Wrangler 建立不同類型的圖形,例如長條圖和散佈圖。例如,您可以產生長條圖來識別資料中的極端值。若要產生資料視覺化,請將分析步驟新增至流程,然後從分析類型中選擇您要建立的視覺化。

如需在 Data Wrangler 中建立視覺化的詳細資訊,請參閱《Amazon SageMaker AI 開發人員指南》中的分析和視覺化

產生資料洞見

您可以使用 Data Wrangler 為 Amazon Personalize 產生資料集類型特有的資料品質和洞見報告。在產生報告之前,我們建議您轉換資料以符合 Amazon Personalize 需求。這將產生更相關的洞見。如需詳細資訊,請參閱轉換資料

報告內容

Amazon Personalize 的資料品質和洞見報告包含下列各節:

  • 摘要:報告摘要包含資料集統計資料和高優先順序警告:

    • 資料集統計資料:這些統計資料包括 Amazon Personalize 特定統計資料,例如互動資料中唯一使用者的數量,以及一般統計資料,例如缺少值或極端值的數量。

    • 高優先順序警告:這些是對訓練或建議影響最大的 Amazon Personalize 特定洞見。每個警告都包含建議的動作,您可以採取這些動作來解決問題。

  • 重複資料列和未完成的資料列:這些區段包含資料列缺少值的資訊,以及資料中重複的資料列。

  • 功能摘要:本節包含每個資料欄的資料類型、無效或缺少的資料資訊,以及警告計數。

  • 功能詳細資訊:本節包含每個資料欄的詳細資訊。每個子區段都包含資料欄的統計資料,例如分類值計數和遺失值資訊。每個小節都包含 Amazon Personalize 特定洞見和資料欄的建議動作。例如,洞見可能表示資料欄有超過 30 個可能的類別。

資料類型問題

報告會識別資料類型不正確的資料欄,並指定所需的類型。若要取得與這些功能相關的洞見,您必須轉換資料欄的資料類型,然後再次產生報告。若要轉換類型,您可以使用 Data Wrangler 將剖析值轉換為類型

Amazon Personalize 洞見

Amazon Personalize 洞見包括問題清單和建議的動作。動作為選用。例如,報告可能包含與類別資料欄的類別數量相關的洞見和動作。如果您不認為資料欄是分類資料,您可以忽略此洞見,不採取任何動作。

除了細微的措辭差異之外,Amazon Personalize 特定洞見與使用 Amazon Personalize 分析資料時可能產生的單一資料集洞見相同。例如,Data Wrangler 中的洞見報告包含洞見,例如「項目互動資料集只有 X 個唯一使用者,且有兩個或更多個互動。」 但它不包括「項目資料集中項目的 X% 等洞見,在項目互動資料集中沒有互動。」

如需可能的 Amazon Personalize 特定洞見清單,請參閱 中未參考多個資料集的洞見資料洞見

報告範例

Amazon Personalize 報告的外觀和感覺與 Data Wrangler 中的一般洞見報告相同。如需一般洞見報告的範例,請參閱《Amazon SageMaker AI 開發人員指南》中的取得對資料和資料品質的洞見。下列範例顯示 項目互動資料集的報告摘要區段。它包含資料集統計資料和一些可能的高優先順序項目互動資料集警告。

描述項目互動資料集的報告摘要區段。

下列範例顯示項目互動資料集的 EVENT_TYPE 資料欄的功能詳細資訊區段可能如何出現在報告中。

描述項目互動資料集的 EVENT_TYPE 資料欄的功能詳細資訊區段。

產生報告

若要產生 Amazon Personalize 的資料品質和洞見報告,您可以選擇取得轉換的資料洞見並建立分析。

為 Amazon Personalize 產生資料品質和洞見報告
  1. 針對您正在分析的轉換選擇 選項。如果您尚未新增轉換,請選擇資料類型轉換的 。Data Wrangler 會自動將此轉換新增至您的流程。

  2. 選擇取得資料洞見。隨即顯示建立分析面板。

  3. 針對分析類型,選擇 Amazon Personalize 的資料品質和洞見報告

  4. 針對資料集類型,選擇您正在分析的 Amazon Personalize 資料集類型。

  5. 選擇性地選擇對完整資料執行。根據預設,Data Wrangler 只會產生對資料範例的洞見。

  6. 選擇 Create (建立)。分析完成時,報告會顯示。