使用視覺化技術探索您的資料 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用視覺化技術探索您的資料

注意

您只能針對以表格式資料集建立的模型使用 SageMaker Canvas 視覺效果。也會排除多類別文字預測模型。

使用 Amazon SageMaker Canvas,您可以在建立機器學習模型之前探索和視覺化資料,以取得資料的進階洞察。您可以使用散佈圖、長條圖和盒狀圖進行視覺化,協助您瞭解資料並探索可能影響模型準確度的功能之間的關係。

在 SageMaker Canvas 應用程式的 [建置] 索引標籤中,選擇 [資料視覺化工具] 開始建立視覺效果。

您可以變更視覺效果取樣大小,以調整從資料集擷取的隨機取樣大小。取樣大小過大可能會影響資料視覺化的效能,因此建議您選擇適當的取樣大小。若要變更取樣大小,請使用下列程序。

  1. 選擇視覺效果取樣

  2. 使用滑桿選擇您想要的取樣大小。

  3. 選擇更新以確認取樣大小的變更。

注意

某些視覺化技術需要特定資料類型的資料欄。例如,散佈圖的 x 軸和 y 軸只能使用數值欄。

散佈圖

若要使用資料集建立散佈圖,請在視覺化面板中選擇散佈圖。從「」區段中選擇要在 x 軸和 y 軸上繪製的特徵。您可以將欄拖放到軸上,或者在放置軸之後,您可以從支援的欄清單中選擇一欄。

您可以使用顏色顯示依據,以第三個特徵為圖表上的資料點著色。您也可以使用分組依據,根據第四個特徵將資料分組為單獨的繪圖。

下列影像顯示使用顏色顯示依據分組依據的散佈圖。在此範例中,每個資料點都由 MaritalStatus 特徵著色,並依 Department 特徵分組,並產生每個部門資料點的散佈圖。

Canvas 應用程式的資料視覺化檢視中散佈圖螢幕擷取畫面。

長條圖

若要使用資料集建立長條圖,請在視覺化面板中選擇長條圖。從「」區段中選擇要在 x 軸和 y 軸上繪製的特徵。您可以將欄拖放到軸上,或者在放置軸之後,您可以從支援的欄清單中選擇一欄。

您可以使用分組依據一句第三個特徵對長條圖進行分組。您可以使用堆疊依據根據第四個特徵的唯一值來針對每個長條描繪垂直陰影。

下列影像顯示使用分組依據堆疊依據的長條圖。在此範例中,長條圖會依 MaritalStatus特徵分組,並依 JobLevel 特徵堆疊。針對 x 軸上的每一個 JobRole,都有一個單獨的長條用於表示 MaritalStatus 特徵中的唯一類別,且每個長條都依據 JobLevel 特徵垂直堆疊。

Canvas 應用程式的資料視覺化工具中的長條圖螢幕擷取畫面。

盒狀圖

若要使用資料集建立盒狀圖,請在視覺化面板中選擇盒狀圖。從「」區段中選擇要在 x 軸和 y 軸上繪製的特徵。您可以將欄拖放到軸上,或者在放置軸之後,您可以從支援的欄清單中選擇一欄。

您可以使用分組依據依據第三個特徵對盒狀圖進行分組。

下列影像顯示使用分組依據的盒狀圖。在此範例中,x 軸和 y 軸分別顯示 JobLevelJobSatisfaction,彩色盒狀圖會依 Department 特徵分組。

Canvas 應用程式的資料視覺化工具中的盒狀圖螢幕擷取畫面。