廣義熵 (GE) - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

廣義熵 (GE)

廣義熵指數 (GE) 測量與觀察到的標籤相比,預測標籤的效益b不平等。當預測為偽陽性時,會出現效益。當負面觀測 (y=0) 具有正面預測 (y'=1) 時,就會發生偽陽性。當觀察標籤和預測標籤相同 (也稱為真陽性和真陰性) 時,也會出現效益。當預測為偽陰性時,不會出現效益。當正面觀測 (y=1) 預測會有負面結果 (y'=0) 時,就會出現偽陰性。效益b的定義如下。

b = y' - y + 1

使用此定義時,偽陽性會收到 2 的效益 b,而偽陰性會收到 0 的效益。真正值和真負值都會獲得1的效益。

GE 指標的計算方式是遵循廣義熵指數 (GE),且權重alpha設定為2。此權重控制對不同效益值的敏感度。較小alpha表示對較小值的敏感度增加。

方程式用 alpha 參數設定為 2 定義廣義熵指數。

以下用於計算 GE 的變數定義如下:

  • bi 是由ith資料點獲得的效益。

  • b' 是所有效益的平均值。

GE 的範圍可以介於 0 到 0.5 之間,其中零值表示所有資料點的效益不平等。當所有輸入都正確預測或所有預測都為偽陽性時,即會發生這種情況。當所有預測都是偽陰性時,GE 是未定義的。

注意

指標 GE 不依賴於有利或不利的構面值。