本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
廣義熵 (GE)
廣義熵指數 (GE) 測量與觀察到的標籤相比,預測標籤的效益b
不平等。當預測為偽陽性時,會出現效益。當負面觀測 (y=0) 具有正面預測 (y'=1) 時,就會發生偽陽性。當觀察標籤和預測標籤相同 (也稱為真陽性和真陰性) 時,也會出現效益。當預測為偽陰性時,不會出現效益。當正面觀測 (y=1) 預測會有負面結果 (y'=0) 時,就會出現偽陰性。效益b
的定義如下。
b = y' - y + 1
使用此定義時,偽陽性會收到 2
的效益 b
,而偽陰性會收到 0
的效益。真正值和真負值都會獲得1
的效益。
GE 指標的計算方式是遵循廣義熵指數alpha
設定為2
。此權重控制對不同效益值的敏感度。較小alpha
表示對較小值的敏感度增加。
以下用於計算 GE 的變數定義如下:
-
bi 是由
ith
資料點獲得的效益。 -
b' 是所有效益的平均值。
GE 的範圍可以介於 0 到 0.5 之間,其中零值表示所有資料點的效益不平等。當所有輸入都正確預測或所有預測都為偽陽性時,即會發生這種情況。當所有預測都是偽陰性時,GE 是未定義的。
注意
指標 GE 不依賴於有利或不利的構面值。