Perbedaan Tingkat Penerimaan (DAR) - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Perbedaan Tingkat Penerimaan (DAR)

Perbedaan metrik tingkat penerimaan (DAR) adalah perbedaan rasio prediksi positif sejati (TP) terhadap positif yang diamati (TP + FP) untuk aspek a dan d. Metrik ini mengukur perbedaan presisi model untuk memprediksi penerimaan dari kedua aspek ini. Presisi mengukur fraksi kandidat yang memenuhi syarat dari kumpulan kandidat yang memenuhi syarat yang diidentifikasi oleh model. Jika presisi model untuk memprediksi pelamar yang memenuhi syarat berbeda antar aspek, ini adalah bias dan besarnya diukur oleh DAR.

Rumus untuk perbedaan tingkat penerimaan antara aspek a dan d:

        DAR = TPa/(TP a +FPa) - TPd/(TP + FP) d d

Di mana:

  • TP a adalah positif sejati yang diprediksi untuk aspek a.

  • FP a adalah positif palsu yang diprediksi untuk segi a.

  • TP d adalah positif sejati yang diprediksi untuk segi d.

  • FP d adalah positif palsu yang diprediksi untuk segi d.

Misalnya, model menerima 70 pelamar paruh baya (aspek a) untuk pinjaman (label positif yang diprediksi) yang hanya 35 yang benar-benar diterima (label positif yang diamati). Juga misalkan model menerima 100 pelamar dari demografi usia lain (segi d) untuk pinjaman (label positif yang diprediksi) di antaranya hanya 40 yang benar-benar diterima (label positif yang diamati). Kemudian DAR = 35/70 - 40/100 = 0,10, yang menunjukkan potensi bias terhadap orang-orang yang memenuhi syarat dari kelompok usia kedua (segi d).

Rentang nilai DAR untuk biner, aspek multikategori, dan label kontinu adalah [-1, +1].

  • Nilai positif terjadi ketika rasio positif yang diprediksi (penerimaan) terhadap hasil positif yang diamati (pelamar yang memenuhi syarat) untuk aspek a lebih besar dari rasio yang sama untuk segi d. Nilai-nilai ini menunjukkan kemungkinan bias terhadap aspek yang tidak disukai d yang disebabkan oleh terjadinya positif palsu yang relatif lebih banyak di segi d. Semakin besar perbedaan rasio, semakin ekstrim bias yang tampak.

  • Nilai mendekati nol terjadi ketika rasio positif yang diprediksi (penerimaan) terhadap hasil positif yang diamati (pelamar yang memenuhi syarat) untuk aspek a dan d memiliki nilai serupa yang menunjukkan label yang diamati untuk hasil positif diprediksi dengan presisi yang sama oleh model.

  • Nilai negatif terjadi ketika rasio positif yang diprediksi (penerimaan) terhadap hasil positif yang diamati (pelamar yang memenuhi syarat) untuk aspek d lebih besar dari aspek rasio a. Nilai-nilai ini menunjukkan kemungkinan bias terhadap aspek yang disukai a yang disebabkan oleh terjadinya positif yang relatif lebih palsu dalam segi a. Semakin negatif perbedaan rasio, semakin ekstrem bias yang tampak.