Metrik Bias Pra-pelatihan - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Metrik Bias Pra-pelatihan

Mengukur bias dalam model ML adalah langkah pertama untuk mengurangi bias. Setiap ukuran bias sesuai dengan gagasan keadilan yang berbeda. Bahkan mempertimbangkan konsep keadilan yang sederhana mengarah pada banyak ukuran berbeda yang berlaku dalam berbagai konteks. Misalnya, pertimbangkan keadilan sehubungan dengan usia, dan, untuk kesederhanaan, bahwa paruh baya dan kelompok usia lainnya adalah dua demografi yang relevan, yang disebut sebagai aspek. Dalam kasus model ML untuk pinjaman, kita mungkin ingin pinjaman usaha kecil dikeluarkan dengan jumlah yang sama dari kedua demografi. Atau, saat memproses pelamar kerja, kami mungkin ingin melihat jumlah anggota yang sama dari setiap demografis yang dipekerjakan. Namun, pendekatan ini mungkin mengasumsikan bahwa jumlah yang sama dari kedua kelompok umur berlaku untuk pekerjaan ini, jadi kami mungkin ingin mengkondisikan nomor yang berlaku. Lebih lanjut, kami mungkin ingin mempertimbangkan bukan apakah angka yang sama berlaku, tetapi apakah kami memiliki jumlah pelamar yang memenuhi syarat yang sama. Atau, kami dapat menganggap keadilan sebagai tingkat penerimaan yang sama dari pelamar yang memenuhi syarat di kedua demografi usia, atau, tingkat penolakan pelamar yang sama, atau keduanya. Anda dapat menggunakan kumpulan data dengan proporsi data yang berbeda pada atribut yang diinginkan. Ketidakseimbangan ini dapat menggabungkan ukuran bias yang Anda pilih. Model mungkin lebih akurat dalam mengklasifikasikan satu aspek daripada yang lain. Dengan demikian, Anda perlu memilih metrik bias yang secara konseptual sesuai untuk aplikasi dan situasi.

Kami menggunakan notasi berikut untuk membahas metrik bias. Model konseptual yang dijelaskan di sini adalah untuk klasifikasi biner, di mana peristiwa diberi label hanya memiliki dua kemungkinan hasil dalam ruang sampelnya, disebut sebagai positif (dengan nilai 1) dan negatif (dengan nilai 0). Kerangka kerja ini biasanya dapat diperluas ke klasifikasi multikategori secara langsung atau untuk kasus-kasus yang melibatkan hasil bernilai berkelanjutan bila diperlukan. Dalam kasus klasifikasi biner, label positif dan negatif ditetapkan ke hasil yang dicatat dalam kumpulan data mentah untuk aspek yang disukai a dan untuk aspek yang tidak disukai d. Label y ini disebut sebagai label yang diamati untuk membedakannya dari label yang diprediksi y' yang ditetapkan oleh model pembelajaran mesin selama tahap pelatihan atau kesimpulan dari siklus hidup ML. Label ini digunakan untuk menentukan distribusi probabilitas P a (y) dan P d (y) untuk hasil faset masing-masing.

  • label:

    • y mewakili n label yang diamati untuk hasil peristiwa dalam kumpulan data pelatihan.

    • y' mewakili label yang diprediksi untuk n label yang diamati dalam kumpulan data oleh model terlatih.

  • hasil:

    • Hasil positif (dengan nilai 1) untuk sampel, seperti penerimaan aplikasi.

      • n (1) adalah jumlah label yang diamati untuk hasil positif (penerimaan).

      • n' (1) adalah jumlah label yang diprediksi untuk hasil positif (penerimaan).

    • Hasil negatif (dengan nilai 0) untuk sampel, seperti penolakan aplikasi.

      • n (0) adalah jumlah label yang diamati untuk hasil negatif (penolakan).

      • n' (0) adalah jumlah label yang diprediksi untuk hasil negatif (penolakan).

  • nilai faset:

    • facet a - Nilai fitur yang mendefinisikan demografis yang disukai bias.

      • n a adalah jumlah label yang diamati untuk nilai faset yang disukai: n a = n a (1) + n a (0) jumlah label yang diamati positif dan negatif untuk aspek nilai a.

      • n' a adalah jumlah label yang diprediksi untuk nilai faset yang disukai: n' a = n' a (1) + n' a (0) jumlah label hasil prediksi positif dan negatif untuk nilai faset a. Perhatikan bahwa n' a = na.

    • facet d — Nilai fitur yang mendefinisikan demografis yang bias tidak disukai.

      • n d adalah jumlah label yang diamati untuk nilai faset yang tidak disukai: n d = n d (1) + n d (0) jumlah label yang diamati positif dan negatif untuk nilai faset d.

      • n' d adalah jumlah label yang diprediksi untuk nilai faset yang tidak disukai: n' d = n' d (1) + n' d (0) jumlah label prediksi positif dan negatif untuk nilai faset d. Perhatikan bahwa n' d = nd.

  • distribusi probabilitas untuk hasil dari hasil data facet berlabel:

    • P a (y) adalah distribusi probabilitas dari label yang diamati untuk faset a. Untuk data berlabel biner, distribusi ini diberikan oleh rasio jumlah sampel dalam faset a berlabel dengan hasil positif terhadap jumlah total, P a (y 1) = n a (1)/na, dan rasio jumlah sampel dengan hasil negatif terhadap jumlah total, P a (y 0) = n a (0)/n. a

    • P d (y) adalah distribusi probabilitas dari label yang diamati untuk faset d. Untuk data berlabel biner, distribusi ini diberikan oleh jumlah sampel dalam segi d berlabel hasil positif terhadap jumlah total, P d (y 1) = n d (1)/nd, dan rasio jumlah sampel dengan hasil negatif terhadap jumlah total, P d (y 0) = n d (0)/n. d

Model yang dilatih pada data yang bias oleh kesenjangan demografis mungkin belajar dan bahkan memperburuknya. Untuk mengidentifikasi bias dalam data sebelum mengeluarkan sumber daya untuk melatih model di dalamnya, SageMaker Clarify menyediakan metrik bias data yang dapat Anda hitung pada kumpulan data mentah sebelum pelatihan. Semua metrik pra-pelatihan adalah model-agnostik karena tidak bergantung pada keluaran model dan valid untuk model apa pun. Metrik bias pertama memeriksa ketidakseimbangan aspek, tetapi bukan hasil. Ini menentukan sejauh mana jumlah data pelatihan representatif di berbagai aspek, seperti yang diinginkan untuk aplikasi. Metrik bias yang tersisa membandingkan distribusi label hasil dengan berbagai cara untuk aspek a dan d dalam data. Metrik yang berkisar di atas nilai negatif dapat mendeteksi bias negatif. Tabel berikut berisi lembar contekan untuk panduan cepat dan tautan ke metrik bias pra-pelatihan.

Metrik Bias Pra-pelatihan

Metrik bias Deskripsi Contoh pertanyaan Menafsirkan nilai metrik
Ketidakseimbangan Kelas (CI) Mengukur ketidakseimbangan jumlah anggota antara nilai faset yang berbeda.

Mungkinkah ada bias berbasis usia karena tidak memiliki cukup data untuk demografis di luar aspek paruh baya?

Rentang dinormalisasi: [-1, +1]

Interpretasi:

  • Nilai positif menunjukkan aspek A memiliki lebih banyak sampel pelatihan dalam kumpulan data.

  • Nilai mendekati nol menunjukkan aspek seimbang dalam jumlah sampel pelatihan dalam kumpulan data.

  • Nilai negatif menunjukkan aspek d memiliki lebih banyak sampel pelatihan dalam kumpulan data.

Perbedaan Proporsi Label (DPL) Mengukur ketidakseimbangan hasil positif antara nilai segi yang berbeda. Mungkinkah ada bias berbasis usia dalam prediksi MLkarena pelabelan bias nilai faset dalam data?

Rentang untuk label aspek biner & multikategori yang dinormalisasi: [-1, +1]

Rentang untuk label kontinu: (-∞, +∞)

Interpretasi:

  • Nilai positif menunjukkan aspek a memiliki proporsi hasil positif yang lebih tinggi.

  • Nilai mendekati nol menunjukkan proporsi hasil positif yang lebih sama antar aspek.

  • Nilai negatif menunjukkan aspek d memiliki proporsi hasil positif yang lebih tinggi.

Divergensi Kullback-Leibler (KL) Mengukur seberapa besar distribusi hasil dari berbagai aspek berbeda berbeda satu sama lain secara entropis. Seberapa berbeda distribusi untuk hasil aplikasi pinjaman untuk kelompok demografis yang berbeda?

Rentang untuk biner, multikategori, kontinu: [0, +∞)

Interpretasi:

  • Nilai mendekati nol menunjukkan label didistribusikan dengan cara yang sama.

  • Nilai positif menunjukkan distribusi label menyimpang, semakin positif semakin besar divergensi.

Divergensi Jensen-Shannon (JS) Mengukur seberapa besar distribusi hasil dari berbagai aspek berbeda berbeda satu sama lain secara entropis. Seberapa berbeda distribusi untuk hasil aplikasi pinjaman untuk kelompok demografis yang berbeda?

Rentang untuk biner, multikategori, kontinu: [0, +∞)

Interpretasi:

  • Nilai mendekati nol menunjukkan label didistribusikan dengan cara yang sama.

  • Nilai positif menunjukkan distribusi label menyimpang, semakin positif semakin besar divergensi.

L p -norma (LP) Mengukur perbedaan p-norma antara distribusi demografis yang berbeda dari hasil yang terkait dengan aspek yang berbeda dalam kumpulan data. Seberapa berbeda distribusi untuk hasil aplikasi pinjaman untuk demografi yang berbeda?

Rentang untuk biner, multikategori, kontinu: [0, +∞)

Interpretasi:

  • Nilai mendekati nol menunjukkan label didistribusikan dengan cara yang sama.

  • Nilai positif menunjukkan distribusi label menyimpang, semakin positif semakin besar divergensi.

Jarak Variasi Total (TVD) Mengukur setengah dari perbedaan 1 norma L antara distribusi demografis yang berbeda dari hasil yang terkait dengan aspek yang berbeda dalam kumpulan data. Seberapa berbeda distribusi untuk hasil aplikasi pinjaman untuk demografi yang berbeda?

Rentang untuk hasil biner, multikategori, dan berkelanjutan: [0, +∞)

  • Nilai mendekati nol menunjukkan label didistribusikan dengan cara yang sama.

  • Nilai positif menunjukkan distribusi label menyimpang, semakin positif semakin besar divergensi.

Kolmogorov-Smirnov (KS) Mengukur divergensi maksimum antara hasil dalam distribusi untuk berbagai aspek dalam kumpulan data. Hasil aplikasi perguruan tinggi mana yang menunjukkan perbedaan terbesar menurut kelompok demografis? Rentang nilai KS untuk hasil biner, multikategori, dan kontinu: [0, +1]
  • Nilai mendekati nol menunjukkan label didistribusikan secara merata antar aspek di semua kategori hasil.

  • Nilai di dekat satu menunjukkan label untuk satu kategori semuanya dalam satu segi, jadi sangat tidak seimbang.

  • Nilai intermiten menunjukkan derajat relatif ketidakseimbangan label maksimum.

Disparitas Demografis Bersyarat () CDD Mengukur perbedaan hasil antara aspek yang berbeda secara keseluruhan, tetapi juga oleh subkelompok. Apakah beberapa kelompok memiliki proporsi penolakan yang lebih besar untuk hasil penerimaan perguruan tinggi daripada proporsi penerimaan mereka?

RentangCDD: [-1, +1]

  • Nilai positif menunjukkan hasil di mana segi d ditolak lebih dari yang diterima.

  • Mendekati nol menunjukkan tidak ada perbedaan demografis rata-rata.

  • Nilai negatif menunjukkan hasil di mana aspek a ditolak lebih dari yang diterima.

Untuk informasi tambahan tentang metrik bias, lihat Fairness Measures for Machine Learning in Finance.