Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods

Jieyu Zhao; Tianlu Wang; Mark Yatskar; Vicente Ordonez; Kai-Wei Chang

publication

Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods

Jieyu Zhao, Tianlu Wang, Mark Yatskar, Vicente Ordonez, Kai-Wei Chang.

North American Chapter of the Association for Computational Linguistics. NAACL 2018. short. New Orleans, Louisiana. June 2018.

Artikel pdf code BibTeX-Quelltext

Nachrichtenredaktion des Labors

Zusammenfassung der Pressemitteilung

Dieser Abschnitt ist bewusst im Stil einer Pressemitteilung in journalistischem Ton für ein allgemeines Publikum verfasst.

Forscher der UCLA, der University of Virginia und des Allen Institute for Artificial Intelligence haben herausgefunden, dass weit verbreitete Koreferenzauflösungssysteme – Software, die erkennt, wann verschiedene Wörter in einem Satz auf dieselbe Person oder Sache verweisen – Geschlechterstereotype systematisch in einer Weise widerspiegeln, die Menschen in realen Anwendungen schaden könnte. Um das Problem zu messen, baute das Team einen neuen Testdatensatz namens WinoBias auf, der aus 3.160 Sätzen besteht, die Berufe mit geschlechtsbezogenen Pronomen in einer Weise verknüpfen, die logisch betrachtet nicht beeinflussen sollte, auf welche Person sich das Pronomen bezieht – es aber oft tut. Als sie drei etablierte Koreferenzsysteme durch WinoBias laufen ließen, schnitten alle drei merklich besser ab, wenn die Pronomen geschlechtsstereotypen Erwartungen entsprachen (etwa wenn "she" mit "nurse" verknüpft wurde), als wenn sie diesen zuwiderliefen, mit einer durchschnittlichen Leistungslücke von 21,1 Punkten auf der F1-Bewertungsskala. Die Forscher führten einen Großteil der Verzerrung auf das OntoNotes-Trainingskorpus zurück, in dem über 80 Prozent der durch geschlechtsbezogene Pronomen bezeichneten Entitäten männlich waren, sowie auf Wort-Embeddings, die stereotype Assoziationen codieren. Um dem entgegenzuwirken, entwickelten sie eine Datenaugmentationstechnik, die eine spiegelbildliche Version der Trainingsdaten erzeugt, indem sie alle männlichen und weiblichen Bezüge vertauscht, und kombinierten sie mit bestehenden Methoden zur Entzerrung von Wort-Embeddings. Diese Kombination schloss die Leistungslücke bei WinoBias wirksam, ohne die Genauigkeit auf Standard-Benchmarks nennenswert zu beeinträchtigen – ein Ergebnis, das von Bedeutung ist, weil die Koreferenzauflösung in ein breites Spektrum nachgelagerter Sprachtechnologien einfließt, was bedeutet, dass unkontrollierte Verzerrungen in diesen Systemen sich unbemerkt durch viele Anwendungen fortpflanzen können.

Zusammenfassung

Wir führen einen neuen Benchmark, WinoBias, für die Koreferenzauflösung mit Fokus auf geschlechtsbezogene Verzerrungen ein. Unser Korpus enthält Sätze im Stil von Winograd-Schemata mit Entitäten, die Personen entsprechen, auf die über ihren Beruf verwiesen wird (z. B. the nurse, the doctor, the carpenter). Wir demonstrieren, dass ein regelbasiertes, ein merkmalsreiches und ein neuronales Koreferenzsystem allesamt geschlechtsbezogene Pronomen mit höherer Genauigkeit mit pro-stereotypen Entitäten verknüpfen als mit anti-stereotypen Entitäten, mit einer durchschnittlichen Differenz von 21,1 im F1-Score. Schließlich demonstrieren wir einen Datenaugmentationsansatz, der in Kombination mit bestehenden Techniken zur Entzerrung von Wort-Embeddings die von diesen Systemen in WinoBias gezeigte Verzerrung beseitigt, ohne ihre Leistung auf bestehenden Koreferenz-Benchmark-Datensätzen wesentlich zu beeinträchtigen. Unser Datensatz und unser Code sind unter http://winobias.org verfügbar.

Details

Anmerkung: NAACL '18 Camera Ready

Zitation

@inproceedings{zhao2018gender,
  title = {Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods},
  author = {Zhao, Jieyu and Wang, Tianlu and Yatskar, Mark and Ordonez, Vicente and Chang, Kai-Wei},
  year = {2018},
  booktitle = {North American Chapter of the Association for Computational Linguistics. NAACL 2018},
  url = {https://arxiv.org/abs/1804.06876},
}