Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Bedingte demografische Disparität () CDD
Die Metrik zur demografischen Disparität (DD) bestimmt, ob bei einer Facet ein größerer Anteil der abgelehnten Ergebnisse im Datensatz als bei den akzeptierten Ergebnissen besteht. Im binären Fall, in dem zwei Facetn, beispielsweise Männer und Frauen, den Datensatz bilden, wird die benachteiligte als Facet d und die bevorzugte als Facet a bezeichnet. Wenn beispielsweise im Fall von Hochschulzulassungen 46% der abgelehnten Bewerberinnen und nur 32% der zugelassenen Bewerber weibliche Bewerber ausmachten, sagen wir, dass es demografische Unterschiede gibt, weil die Rate, mit der Frauen abgelehnt wurden, die Rate, mit der sie aufgenommen wurden, übersteigt. Bewerberinnen werden in diesem Fall als Facet a bezeichnet. Wenn die männlichen Bewerber 54% der abgelehnten und 68% der zugelassenen Bewerber ausmachten, dann besteht in dieser Hinsicht kein demografischer Unterschied, da die Ablehnungsquote geringer ist als die Zulassungsquote. Männliche Bewerber werden in diesem Fall als Facet a bezeichnet.
Die Formel für die demografische Disparität in Bezug auf die benachteiligte Facet d lautet wie folgt:
DDd = nd(0)/n(0) – nd(1)/n(1) = PdR(y0) – PdA(y1)
Wobei gilt:
-
n(0) = na(0) + nd(0) ist die Gesamtzahl der abgelehnten Ergebnisse im Datensatz für die bevorzugte Facet a und die benachteiligte Facet d.
-
n(1) = na(1) + nd(1) ist die Gesamtzahl der akzeptierten Ergebnisse im Datensatz für die bevorzugte Facet a und die benachteiligte Facet d.
-
PdR(y0) ist der Anteil der abgelehnten Ergebnisse (mit dem Wert 0) in Facet d.
-
PdA(y1) ist der Anteil der akzeptierten Ergebnisse (Wert 1) in Facet d.
Für das Beispiel der Hochschulzulassung beträgt die demografische Disparität für Frauen DDd = 0.46 – 0.32 = 0.14. Für Männer DDa = 0.54 – 0.68 = – 0.14.
Um das Simpson-Paradoxon auszuschließen, ist eine Metrik für bedingte demografische Disparität (CDD) erforderlich, die DD anhand von Attributen konditioniert, die eine Schicht von Untergruppen im Datensatz definieren. Die Umgruppierung kann Aufschluss über die Ursache offensichtlicher demografischer Disparitäten bei benachteiligten Facetn geben. Der klassische Fall trat bei den Zulassungen in Berkeley auf, wo Männer insgesamt häufiger aufgenommen wurden als Frauen. Die Statistiken für diesen Fall wurden in den Beispielberechnungen von DD verwendet. Bei der Untersuchung der Untergruppen der einzelnen Abteilungen wurde jedoch gezeigt, dass Frauen höhere Zulassungsquoten aufwiesen als Männer, wenn sie nach Fachbereichen unterschieden werden. Die Erklärung dafür war, dass sich Frauen in Abteilungen mit niedrigeren Zulassungsquoten beworben hatten als Männer. Die Untersuchung der Annahmequoten nach Untergruppen ergab, dass Frauen in den Abteilungen mit niedrigeren Annahmequoten tatsächlich häufiger aufgenommen wurden als Männer.
Die CDD Metrik gibt eine einzige Messgröße für alle Disparitäten an, die in den durch ein Attribut eines Datensatzes definierten Untergruppen gefunden wurden, indem deren Durchschnitt gebildet wird. Sie ist definiert als gewichteter Durchschnitt der demografischen Disparitäten (DDi) für jede der Untergruppen, wobei die Disparität jeder Untergruppe proportional zur Anzahl der darin enthaltenen Beobachtungen gewichtet wird. Die Formel für die bedingte demografische Disparität lautet wie folgt:
CDD= (1/n) n DD * i i * i
Wobei gilt:
-
∑ini = n ist die Gesamtzahl der Beobachtungen und n i ist die Anzahl der Beobachtungen für jede Untergruppe.
-
DD i = n i (0) /n (0) – n i (1) /n (1) = P i R (y 0) – P i A (y 1) ist die demografische Disparität für die i-te Untergruppe.
Die demografische Disparität für eine Untergruppe (DDi) ist der Unterschied zwischen dem Anteil der abgelehnten Ergebnisse und dem Anteil der akzeptierten Ergebnisse für jede Untergruppe.
Der Bereich der DD-Werte für binäre Ergebnisse für den vollständigen Datensatz DDd oder für seine konditionalisierten Untergruppen DDi ist [-1, +1].
-
+1: wenn es keine Ablehnungen in Facet a oder Untergruppe und keine Akzeptanz in Facet d oder Untergruppe gibt
-
Positive Werte deuten auf eine demografische Disparität hin, da Facet d oder Untergruppe einen größeren Anteil der abgelehnten Ergebnisse im Datensatz als der akzeptierten Ergebnisse aufweist. Je höher der Wert, desto weniger beliebt ist die Facet und desto größer ist die Disparität.
-
Negative Werte deuten darauf hin, dass kein demografischer Unterschied besteht, da die Facet d oder die Untergruppe einen größeren Anteil der akzeptierten Ergebnisse im Datensatz als der abgelehnten Ergebnisse aufweist. Je niedriger der Wert, desto bevorzugter ist die Facet.
-
-1: wenn es keine Ablehnungen in Facet d oder Untergruppe und keine Akzeptanz in Facet a oder Untergruppe gibt
Wenn du an nichts konditionierst, dann CDD ist Null genau dann, wenn DPL es Null ist.
Diese Kennzahl ist nützlich, um die Konzepte der direkten und indirekten Diskriminierung sowie der objektiven Rechtfertigung in den Antidiskriminierungsgesetzen und der Rechtsprechung der EU und des Vereinigten Königreichs zu untersuchen. Weitere Informationen finden Sie unter Warum Fairness nicht automatisiert werden kann