Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Perbedaan spesifisitas (SD)
Perbedaan spesifisitas (SD) adalah perbedaan spesifisitas antara faset yang disukai a dan aspek yang tidak disukai d. Spesifisitas mengukur seberapa sering model memprediksi hasil negatif dengan benar (y'=0). Setiap perbedaan dalam kekhususan ini adalah bentuk bias potensial.
Spesifisitas sempurna untuk suatu segi jika semua kasus y=0 diprediksi dengan benar untuk segi tersebut. Spesifisitas lebih besar ketika model meminimalkan positif palsu, yang dikenal sebagai kesalahan Tipe I. Misalnya, perbedaan antara spesifisitas rendah untuk pinjaman ke segi a, dan spesifisitas tinggi untuk pinjaman ke segi d, adalah ukuran bias terhadap segi d.
Rumus berikut adalah untuk perbedaan spesifisitas untuk segi a dan d.
SD = TNd/(dTN+FPd) - TNa/(aaTN+FP) = TNR - TNR d a
Variabel berikut yang digunakan untuk menghitung SD didefinisikan sebagai berikut:
-
TN d adalah negatif sebenarnya yang diprediksi untuk segi d.
-
FP d adalah positif palsu yang diprediksi untuk segi d.
-
TN d adalah negatif sebenarnya yang diprediksi untuk aspek a.
-
FP d adalah positif palsu yang diprediksi untuk segi a.
-
TNR a = TNa/(aTN+FPa) adalah tingkat negatif sebenarnya, juga dikenal sebagai spesifisitas, untuk segi a.
-
TNR d = TNd/(dTN+FPd) adalah tingkat negatif sebenarnya, juga dikenal sebagai spesifisitas, untuk segi d.
Misalnya, perhatikan matriks kebingungan berikut untuk segi a dan d.
Matriks kebingungan untuk segi yang disukai a
Prediksi kelas a | Hasil aktual 0 | Hasil aktual 1 | Total |
---|---|---|---|
0 | 20 | 5 | 25 |
1 | 10 | 65 | 75 |
Total | 30 | 70 | 100 |
Matriks kebingungan untuk segi yang tidak disukai d
Prediksi kelas d | Hasil aktual 0 | Hasil aktual 1 | Total |
---|---|---|---|
0 | 18 | 7 | 25 |
1 | 5 | 20 | 25 |
Total | 23 | 27 | 50 |
Nilai perbedaan spesifisitas adalahSD = 18/(18+5) - 20/(20+10) = 0.7826
- 0.6667 = 0.1159
, yang menunjukkan bias terhadap segi d.
Rentang nilai untuk perbedaan spesifisitas antara aspek a dan d untuk klasifikasi biner dan multikategori adalah. [-1, +1]
Metrik ini tidak tersedia untuk kasus label kontinu. Inilah yang disiratkan oleh nilai-nilai SD yang berbeda:
-
Nilai positif diperoleh ketika ada spesifisitas yang lebih tinggi untuk faset d daripada faset a. Ini menunjukkan bahwa model menemukan lebih sedikit positif palsu untuk faset d daripada untuk faset a. Nilai positif menunjukkan bias terhadap segi d.
-
Nilai mendekati nol menunjukkan bahwa spesifisitas untuk segi yang dibandingkan serupa. Ini menunjukkan bahwa model menemukan jumlah positif palsu yang sama di kedua aspek ini dan tidak bias.
-
Nilai negatif diperoleh ketika ada spesifisitas yang lebih tinggi untuk faset a daripada faset d. Ini menunjukkan bahwa model menemukan lebih banyak positif palsu untuk faset a daripada untuk segi d. Nilai negatif menunjukkan bias terhadap segi a.