Perbedaan Penolakan Bersyarat () DCR - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Perbedaan Penolakan Bersyarat () DCR

Metrik ini membandingkan label yang diamati dengan label yang diprediksi oleh model dan menilai apakah ini sama di seluruh aspek untuk hasil negatif (penolakan). Metrik ini mendekati meniru bias manusia, dalam hal itu mengukur berapa banyak lagi hasil negatif yang diberikan model (label yang diprediksi y') ke aspek tertentu dibandingkan dengan apa yang disarankan oleh label dalam kumpulan data pelatihan (label yang diamati y). Misalnya, jika ada lebih banyak penolakan yang diamati (hasil negatif) untuk aplikasi pinjaman untuk kelompok paruh baya (aspek a) daripada yang diprediksi oleh model berdasarkan kualifikasi dibandingkan dengan aspek yang mengandung kelompok usia lain (segi d), ini mungkin menunjukkan potensi bias dalam cara pinjaman ditolak yang lebih disukai kelompok paruh baya daripada kelompok lain.

Rumus untuk perbedaan penerimaan bersyarat:

        DCR= r d - r a

Di mana:

  • r d = n d (0)/n' d (0) adalah rasio jumlah hasil negatif yang diamati dari nilai 0 (penolakan) dari segi d terhadap jumlah prediksi hasil negatif (penolakan) untuk segi d.

  • r a = n a (0)/n' a (0) adalah rasio jumlah hasil negatif yang diamati dari nilai 0 (penolakan) dari segi a terhadap jumlah prediksi hasil negatif dari nilai 0 (penolakan) untuk segi a.

DCRMetrik dapat menangkap bias positif dan negatif yang mengungkapkan perlakuan preferensial berdasarkan kualifikasi. Pertimbangkan contoh bias berbasis usia berikut pada penolakan pinjaman.

Contoh 1: Bias positif

Misalkan kita memiliki kumpulan data 100 orang paruh baya (segi a) dan 50 orang dari kelompok usia lain (segi d) yang mengajukan pinjaman, di mana model merekomendasikan bahwa 60 dari segi a dan 30 dari segi d ditolak untuk pinjaman. Jadi proporsi yang diprediksi tidak bias oleh DPPL metrik, tetapi label yang diamati menunjukkan bahwa 50 dari segi a dan 40 dari segi d ditolak. Dengan kata lain, model menolak 17% lebih banyak pinjaman dari segi paruh baya daripada label yang diamati dalam data pelatihan yang disarankan (50/60 = 0,83), dan menolak pinjaman 33% lebih sedikit dari kelompok usia lain daripada label yang diamati yang disarankan (40/30 = 1,33). DCRNilai mengukur perbedaan ini dalam rasio tingkat penolakan yang diamati terhadap prediksi antara faset. Nilai positif menunjukkan bahwa ada bias potensial yang mendukung kelompok paruh baya dengan tingkat penolakan yang lebih rendah dibandingkan dengan kelompok lain daripada yang ditunjukkan oleh data yang diamati (dianggap tidak bias).

        DCR= 40/30 - 50/60 = 1/2

Contoh 2: Bias negatif

Misalkan kita memiliki kumpulan data 100 orang paruh baya (segi a) dan 50 orang dari kelompok usia lain (segi d) yang mengajukan pinjaman, di mana model merekomendasikan bahwa 60 dari segi a dan 30 dari segi d ditolak untuk pinjaman. Jadi proporsi yang diprediksi tidak bias oleh DPPL metrik, tetapi label yang diamati menunjukkan bahwa 70 dari segi a dan 20 dari segi d ditolak. Dengan kata lain, model menolak pinjaman 17% lebih sedikit dari segi paruh baya daripada label yang diamati dalam data pelatihan yang disarankan (70/60 = 1,17), dan menolak 33% lebih banyak pinjaman dari kelompok usia lain daripada label yang diamati yang disarankan (20/30 = 0,67). Nilai negatif menunjukkan bahwa ada bias potensial yang mendukung aspek a dengan tingkat penolakan yang lebih rendah dibandingkan dengan aspek paruh baya a daripada yang ditunjukkan oleh data yang diamati (dianggap tidak bias).

        DCR= 20/30 - 70/60 = -1/2

Kisaran nilai untuk perbedaan penolakan bersyarat untuk biner, aspek multikategori, dan label kontinu adalah (-∞, +∞).

  • Nilai positif terjadi ketika rasio jumlah penolakan yang diamati dibandingkan dengan prediksi penolakan untuk segi d lebih besar dari rasio untuk faset a. Nilai-nilai ini menunjukkan kemungkinan bias terhadap pelamar yang memenuhi syarat dari segi a. Semakin besar nilai DCR metrik, semakin ekstrim bias yang tampak.

  • Nilai mendekati nol terjadi ketika rasio jumlah penolakan yang diamati dibandingkan dengan penerimaan yang diprediksi untuk faset a mirip dengan rasio untuk segi d. Nilai-nilai ini menunjukkan bahwa tingkat penolakan yang diprediksi konsisten dengan nilai yang diamati dalam data berlabel dan bahwa pelamar yang memenuhi syarat dari kedua aspek ditolak dengan cara yang sama.

  • Nilai negatif terjadi ketika rasio jumlah penolakan yang diamati dibandingkan dengan prediksi penolakan untuk segi d kurang dari aspek rasio a. Nilai-nilai ini menunjukkan kemungkinan bias terhadap pelamar yang memenuhi syarat dari segi d. Semakin besar besarnya DCR metrik negatif, semakin ekstrim bias yang tampak.