本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
增加 ML 洞見來偵測極端值和主要驅動因素
您可以新增 ML 洞見來偵測異常 (看起來很重要的極端值)。首先,您需要為洞見建立一個小工具 (也稱為自動敘述)。設定選項時,您可以在螢幕右側的預覽窗格中,檢視洞見的有限螢幕擷取畫面。
在洞見小工具中,您最多可以新增五個非計算欄位的維度欄位。在欄位集區中,類別的值代表 Amazon QuickSight 用來分割指標的維度值。例如,假設您正在分析所有產品類別和產品 的收入SKUs。有 10 個產品類別,每個類別都有 10 個產品SKUs。Amazon QuickSight 會將指標除以 100 個唯一組合,並在分割的每個組合上執行異常偵測。
以下程序展示如何執行此操作,以及如何新增貢獻分析以偵測導致每個異常的主要驅動因素。您可以稍後新增貢獻分析,如 使用主要驅動因素的貢獻分析 中所述。
設定極端值分析 (包括驅動因素)
-
開啟您的分析,然後在工具列中選擇 Insights ,然後選擇新增 。從清單選擇 Anomaly detection (異常偵測) 和 Select (選取)。
-
遵循新的小工具上的螢幕提示,這會告訴您為洞見選擇欄位。至少新增一個日期、一個度量和一個維度。
-
在小工具上選擇 Get started (開始使用)。組態畫面隨即出現。
-
在運算選項下,選擇下列選項的值。
-
針對要分析的組合,選擇以下選項之一:
-
階層
若要按階層分析欄位,請選擇此選項。例如,如果您選擇日期 (T)、量值 (N) 和三個維度類別 (C1、C2 和 C3),則依階層 QuickSight 分析欄位,如下所示。
T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N
-
精確
若只要分析「類別」欄位集中列出的欄位的確切組合,請選擇此選項。例如,如果您選擇日期 (T)、量值 (N) 和三個維度類別 (C1、C2 和 C3),則只會依列出的順序 QuickSight 分析類別欄位的確切組合,如下所示。
T-C1-C2-C3-N
-
全部
若要分析「類別」欄位集中的所有欄位組合,請選擇此選項。例如,如果您選擇日期 (T)、量值 (N) 和三個維度類別 (C1、C2 和 C3),則 QuickSight 分析欄位的所有組合,如下所示。
T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N, T-C1-C3-N, T-C2-N, T-C2-C3-N, T-C3-N
如果您只選擇日期和量值, 會依日期分析欄位,然後依量值 QuickSight 分析欄位。
在要分析的欄位區段中,您可以看到欄位集的欄位清單 (供參考用)。
-
-
對於名稱,輸入不含空白的描述性字母數字名稱,或選擇預設值。如此便可為運算命名。
如果您計劃編輯自動顯示在小工具上的敘述,您可以使用名稱來識別這個小工具的運算。但是,如果您規劃編輯自動敘述,並且在分析中有其他類似的運算,請自訂名稱。
-
-
在顯示選項區段中,選擇以下選項來自訂洞見小工具中顯示的內容。無論顯示什麼,您仍然可以探索所有結果。
-
要顯示的異常狀況數量上限:要在敘述小工具中顯示的極端值數量。
-
嚴重性:要在洞見小工具中顯示的異常的最低嚴重程度。
嚴重性等級 是一系列異常分數,其特徵為範圍中包含的最低實際異常分數。所有分數較高的異常都包含在此範圍內。如果您將嚴重性設定為低,洞見會顯示等級在低和非常高之間的所有異常。如果您將嚴重性設定為 Very high (非常高),洞見只會顯示具有最高異常評分的異常。
您可以使用下列選項 :
-
非常高
-
高度以上
-
中等以上
-
低度以上
-
-
方向:要識別為異常的 x 軸或 y 軸方向。您可以選擇下列項目:
-
高於預期,將較高值識別為異常。
-
低於預期,將較低值識別為異常。
-
【ALL】 以識別所有異常值,高值和低值 (預設設定)。
-
-
差異:輸入用於識別異常的自訂值。任何高於臨界值的數量都會視為異常。這個值會變更洞見在分析中的運作方式。在此章節中,您可以設定下列項目:
-
絕對值:要使用的實際值。例如,如果將此設定為 48, QuickSight 然後,當值與預期值之間的差異大於 48 時,Amazon 會將值識別為異常。
-
百分比:要使用的百分比閾值。例如,如果您將此設定為 12.5%, QuickSight 然後,當值與預期值之間的差異大於 12.5% 時,Amazon 會將值識別為異常。
-
-
排序依據:選擇結果的排序方法。有些方法是以 Amazon QuickSight 產生的異常分數為基礎。Amazon 為看起來異常的資料點 QuickSight 提供更高的分數。您可以使用下列任一選項:
-
加權的異常分數:乘以實際值和預期值差異絕對值對數的異常分數。此分數一律為正數。
-
異常分數:指派給此資料點的實際異常分數。
-
加權的預期值差異:乘以實際值和預期值差異的異常分數 (預設值)。
-
與預期值的差異:實際值與預期值間的實際差異 (即實際預期)。
-
實際值:未套用公式的實際值。
-
-
-
在排程選項區段中,您可以設定排程,以自動執行洞見重新計算。僅發佈的儀表板才會執行排程。在分析中,您可以依需要手動執行。排程包括下列設定:
-
出現次數:設定多久要重新計算一次 (每小時、每天、每週或每月)。
-
排程開始日期:設定開始執行此排程的日期和時間。
-
時區:設定排程執行的時區。若要檢視清單,請刪除目前項目。
-
-
在 最大貢獻者 區段中,設定 Amazon 在偵測到異常值 (異常) 時 QuickSight 分析關鍵驅動因素。
例如,Amazon QuickSight 可以顯示導致美國家庭改善產品銷售額飆升的頂級客戶。您可以從資料集中新增最多四個維度。其中包括您未新增到此洞見小工具的欄位集的維度。
如需可供貢獻分析的維度清單,請選擇選取欄位。
-
選擇儲存以確認選擇。若要退出而不儲存,請選擇 Cancel (取消)。
-
從洞見小工具選擇立即執行,以執行異常偵測並檢視洞見。
完成異常偵測所需的時間各有不同,取決於您正在分析的唯一資料點數量。最少的資料點只需要數分鐘就能完成此流程,但此流程也可能會執行數小時。
在背景中執行時,您可以在分析中進行其他工作。請等待它完成後,再變更組態、編輯內容或開啟探索異常頁面以取得此洞見。
洞見小工具需要至少執行一次才能顯示結果。如果您認為狀態可能已過期,可以重新整理頁面。洞見可以有以下狀態。
出現在頁面上 | Status |
---|---|
Run now (立即執行) 按鈕 | 任務尚未開始。 |
關於 Analyzing for anomalies (分析異常) 的訊息 | 任務目前正在執行中。 |
有關偵測到的異常情況的敘述 (極端值) | 任務已順利執行。訊息指出這個小工具的運算何時最後更新。 |
帶有驚嘆號的提醒圖示 (!) | 此圖示表示上次執行期間發生錯誤。如果同時有顯示敘述,您仍然可以使用 Explore anomalies (探索異常) 來使用前一次成功執行的資料。 |