可解釋性報告 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

可解釋性報告

Amazon SageMaker Autopilot 提供可解釋性報告,以協助解釋最佳模型候選者如何預測文字分類問題。本報告可協助機器學習 (ML) 工程師、產品經理和其他內部利害關係人了解模型的特性。消費者和監管機構都仰賴機器學習的透明度來信任和解譯在模型預測上做出的決定。您可以使用這些說明來稽核和符合法規要求、建立對模型的信任、支援人為決定,以及偵錯和改善模型效能。

用於文字分類的 Autopilot 解釋性功能使用公理屬性方法整合式漸層。這種方法依賴於深度網路公理屬性的實作。

Autopilot 會以JSON檔案形式產生可解釋性報告。報告包含基於驗證資料集的分析詳細資訊。用於產生報告的每個範例都包含下列資訊:

  • text:已解釋的輸入文字內容。

  • token_scores:文字中每個權杖的分數清單。

    • attribution:描述權杖重要性的分數。

    • description.partial_text:代表權杖的部分子字串。

  • predicted_label:由最佳模型候選項目預測的標籤類別。

  • probability:預測 predicted_label 的信賴度。

您可以在 BestCandidate.CandidateProperties.CandidateArtifactLocations.Explainability 上的 DescribeAutoMLJobV2 回應中,找到針對最佳候選項目產生之可解釋性成品的 Amazon S3 字首。

以下是您可以在可解釋性成品中找到的分析內容範例。

{ "text": "It was a fantastic movie!", "predicted_label": 2, "probability": 0.9984835, "token_scores": [ { "attribution": 0, "description": { "partial_text": "It" } }, { "attribution": -0.022447118861679088, "description": { "partial_text": "was" } }, { "attribution": -0.2164326456817965, "description": { "partial_text": "a" } }, { "attribution": 0.675, "description": { "partial_text": "fantastic" } }, { "attribution": 0.416, "description": { "partial_text": "movie!" } } ] }

在此JSON報告的範例中,解釋性功能會評估文字,It was a fantastic movie!並計算每個字符對整體預測標籤的貢獻。預測標籤為 2,這是一種強烈的正面情緒,機率為 99.85%。然後,JSON範例會詳細說明每個個別權杖對此預測的貢獻。例如,權杖 fantastic 具有比權杖 was 更強的屬性。這是對最終預測做出最大貢獻的權杖。