Dampak Berbeda (DI) - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Dampak Berbeda (DI)

Perbedaan proporsi positif dalam metrik label yang diprediksi dapat dinilai dalam bentuk rasio.

Perbandingan proporsi positif dalam metrik label yang diprediksi dapat dinilai dalam bentuk rasio, bukan sebagai perbedaan, seperti halnya dengan. Perbedaan Proporsi Positif pada Label yang Diprediksi (DPPL) Metrik dampak berbeda (DI) didefinisikan sebagai rasio proporsi prediksi positif (y' = 1) untuk segi d atas proporsi prediksi positif (y' = 1) untuk faset a. Misalnya, jika prediksi model memberikan pinjaman kepada 60% dari kelompok paruh baya (aspek a) dan 50% kelompok usia lainnya (segi d), maka DI = .5/.6 = 0,8, yang menunjukkan bias positif dan dampak buruk pada kelompok usia lainnya yang diwakili oleh segi d.

Rumus untuk rasio proporsi label yang diprediksi:

        DI = q' d /q 'a

Di mana:

  • q' a = n' a (1) /n a adalah proporsi prediksi dari segi a yang mendapatkan hasil positif dari nilai 1. Dalam contoh kami, proporsi aspek paruh baya diprediksi akan diberikan pinjaman. Di sini n' a (1) mewakili jumlah anggota faset a yang mendapatkan hasil prediksi positif dan n a adalah jumlah anggota faset a.

  • q' d = n' d (1) /n d adalah proporsi yang diprediksi dari segi d a yang mendapatkan hasil positif dari nilai 1. Dalam contoh kita, aspek orang tua dan muda diprediksi akan diberikan pinjaman. Di sini n' d (1) mewakili jumlah anggota faset d yang mendapatkan hasil prediksi positif dan n d adalah jumlah anggota segi d.

Untuk biner, aspek multikategori, dan label kontinu, nilai DI berkisar selama interval [0, ∞).

  • Nilai kurang dari 1 menunjukkan bahwa faset a memiliki proporsi hasil positif yang diprediksi lebih tinggi daripada segi d. Ini disebut sebagai bias positif.

  • Nilai 1 menunjukkan paritas demografis.

  • Nilai yang lebih besar dari 1 menunjukkan bahwa faset d memiliki proporsi hasil positif yang diprediksi lebih tinggi daripada segi a. Ini disebut sebagai bias negatif.