概觀

焦點模式

概觀 - AWS 方案指引

可解譯模型是什麼，或哪些資訊足以解釋模型，沒有普遍接受的定義。本指南著重於常用的功能重要性概念，其中每個輸入功能的重要性分數用於解釋它如何影響模型輸出。此方法提供洞見，但也需要小心。特徵重要性分數可能會誤導，應仔細分析，包括盡可能向主題專家進行驗證。具體而言，我們建議您不要在沒有驗證的情況下信任特徵重要性分數，因為錯誤解釋可能會導致業務決策不佳。

在下圖中，虹膜的測量特徵會傳遞至預測植物物種的模型，並顯示此預測的相關特徵重要性 (SHAP 屬性）。在這種情況下，花勺長度、花勺寬度和同勺長度都對 Iris virginica 的分類有正面貢獻，但同勺寬度有負面貢獻。（此資訊是以【4】的 iris 資料集為基礎。)

特徵重要性分數可以是全域的，表示分數對所有輸入或本機的模型有效，表示分數適用於單一模型輸出。本機特徵重要性分數通常會進行擴展和加總，以產生模型輸出值，因此稱為屬性。簡單的模型會被視為更易解譯，因為輸入功能對模型輸出的影響更容易理解。例如，在線性迴歸模型中，係數的幅度提供全域特徵重要性分數，對於指定的預測，本機特徵屬性是其係數和特徵值的乘積。如果沒有直接的本機特徵重要性分數來進行預測，您可以從一組基準輸入特徵計算重要性分數，以了解特徵相對於基準的貢獻。