Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Kolmogorov-Smirnov (KS)
Metrik bias Kolmogorov-Smirnov (KS) sama dengan divergensi maksimum antara label dalam distribusi untuk aspek a dan d dari kumpulan data. Uji KS dua sampel yang dilaksanakan oleh SageMaker Clarify melengkapi ukuran ketidakseimbangan label lainnya dengan menemukan label yang paling tidak seimbang.
Rumus untuk metrik Kolmogorov-Smirnov adalah sebagai berikut:
KS = maks (|P a (y) - P d (y) |)
Misalnya, asumsikan sekelompok pelamar (aspek a) ke perguruan tinggi ditolak, daftar tunggu, atau diterima masing-masing 40%, 40%, 20% dan bahwa tarif ini untuk pelamar lain (aspek d) adalah 20%, 10%, 70%. Maka nilai metrik bias Kolmogorov-Smirnov adalah sebagai berikut:
KS = maks (|0,4-0,2 |, |0,4-0,1|, |0,2-0,7 |) = 0,5
Ini memberi tahu kita perbedaan maksimum antara distribusi faset adalah 0,5 dan terjadi pada tingkat penerimaan. Ada tiga istilah dalam persamaan karena label adalah multikelas kardinalitas tiga.
Rentang nilai LP untuk hasil biner, multikategori, dan kontinu adalah [0, +1], di mana:
-
Nilai mendekati nol menunjukkan label didistribusikan secara merata antar aspek di semua kategori hasil. Misalnya, kedua aspek yang mengajukan pinjaman mendapat 50% dari penerimaan dan 50% dari penolakan.
-
Nilai di dekat satu menunjukkan label untuk satu hasil semuanya dalam satu segi. Misalnya, facet a mendapat 100% dari penerimaan dan facet d tidak punya.
-
Nilai intermiten menunjukkan derajat relatif ketidakseimbangan label maksimum.