Disparate Impact (DI) - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Disparate Impact (DI)

Der Unterschied zwischen den positiven Proportionen in der Metrik für prognostizierte Kennzeichnungen kann in Form eines Verhältnisses bewertet werden.

Der Vergleich positiver Anteile in der Metrik für vorhergesagte Kennzeichnungen kann in Form eines Verhältnisses und nicht als Unterschied bewertet werden, wie dies bei der Unterschied bei den positiven Anteilen bei den vorhergesagten Kennzeichnungen () DPPL der Fall ist. Die Kennzahl für unterschiedliche Auswirkungen (DI) ist definiert als das Verhältnis des Anteils positiver Vorhersagen (y' = 1) für Facet d zum Anteil positiver Vorhersagen (y' = 1) für Facet a. Wenn die Modellprognosen beispielsweise Kredite für 60% einer Gruppe mittleren Alters (Facet a) und 50% für andere Altersgruppen (Facet d) gewähren, dann ist DI = .5/.6 = 0.8, was auf eine positive Tendenz und negative Auswirkungen auf die andere Altersgruppe, die durch Facet d repräsentiert wird, hindeutet.

Die Formel für das Verhältnis der Anteile der vorhergesagten Kennzeichnungen lautet wie folgt:

        DI = q'd/q'a

Wobei gilt:

  • q'a = n'a(1)/na ist der vorhergesagte Anteil der Facet a, die ein positives Ergebnis mit dem Wert 1 erzielen. In unserem Beispiel ist dies der Anteil der Personen mittleren Alters, für die prognostiziert wurde, dass ihnen ein Kredit gewährt wird. Dabei steht n'a(1) für die Anzahl der Mitglieder der Facet a, die ein positives prognostiziertes Ergebnis erzielen, und na für die Anzahl der Mitglieder der Facet a.

  • q'd = n'd(1)/nd ist der vorhergesagte Anteil der Facet d a, die ein positives Ergebnis mit dem Wert 1 erzielen. In unserem Beispiel wird für eine Facet älterer und jüngerer Menschen prognostiziert, dass ihnen ein Kredit gewährt wird. Hier steht n' d (1) für die Anzahl der Mitglieder der Facet d, die ein positives prognostiziertes Ergebnis erzielen, und n für d die Anzahl der Mitglieder der Facet d.

Bei binären, mehrkategorialen Facetnbezeichnungen und kontinuierlichen Beschriftungen liegen die DI-Werte im Bereich des Intervalls [0, ∞).

  • Werte unter 1 weisen darauf hin, dass die Facet a einen höheren Anteil an prognostizierten positiven Ergebnissen aufweist als die Facet d. Dies wird als positive Verzerrung bezeichnet.

  • Ein Wert von 1 steht für demografische Parität.

  • Werte über 1 weisen darauf hin, dass Facet d einen höheren Anteil an prognostizierten positiven Ergebnissen aufweist als Facet a. Dies wird als negative Verzerrung bezeichnet.