Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods
Resumen de prensa
Investigadores de UCLA, la Universidad de Virginia y el Allen Institute for Artificial Intelligence han descubierto que los sistemas de resolución de correferencia ampliamente utilizados — software que identifica cuándo diferentes palabras en una oración se refieren a la misma persona o cosa — reflejan sistemáticamente estereotipos de género de maneras que podrían perjudicar a las personas en aplicaciones reales. Para medir el problema, el equipo construyó un nuevo conjunto de datos de prueba llamado WinoBias, que consta de 3,160 oraciones que emparejan ocupaciones con pronombres con marca de género de maneras que no deberían, lógicamente, influir en a qué persona se refiere el pronombre — pero a menudo lo hacen. Cuando ejecutaron tres sistemas de correferencia establecidos a través de WinoBias, los tres se desempeñaron notablemente mejor cuando los pronombres coincidían con las expectativas estereotípicas de género (vinculando "ella" con "enfermera", por ejemplo) que cuando iban en contra de ellas, con una brecha de rendimiento promedio de 21.1 puntos en la escala de puntuación F1. Los investigadores rastrearon gran parte del sesgo hasta el corpus de entrenamiento OntoNotes, donde más del 80 por ciento de las entidades referidas por pronombres con marca de género eran masculinas, y hasta los embeddings de palabras que codifican asociaciones estereotipadas. Para contrarrestar esto, desarrollaron una técnica de aumento de datos que genera una versión espejo de los datos de entrenamiento intercambiando todas las referencias masculinas y femeninas, y la combinaron con métodos existentes para la mitigación de sesgo en embeddings de palabras. Esa combinación cerró efectivamente la brecha de rendimiento en WinoBias sin perjudicar significativamente la precisión en benchmarks estándar — un resultado que importa porque la resolución de correferencia alimenta una amplia gama de tecnologías del lenguaje posteriores, lo que significa que el sesgo no controlado en estos sistemas puede propagarse silenciosamente a través de muchas aplicaciones.
resumen
Presentamos un nuevo benchmark, WinoBias, para la resolución de correferencia centrado en el sesgo de género. Nuestro corpus contiene oraciones de estilo esquema de Winograd con entidades correspondientes a personas referidas por su ocupación (por ejemplo, la enfermera, el doctor, el carpintero). Demostramos que un sistema de correferencia basado en reglas, uno rico en características y uno neuronal vinculan los pronombres con marca de género a entidades pro-estereotípicas con mayor precisión que a entidades anti-estereotípicas, por una diferencia promedio de 21.1 en la puntuación F1. Finalmente, demostramos un enfoque de aumento de datos que, en combinación con técnicas existentes de mitigación de sesgo en embeddings de palabras, elimina el sesgo demostrado por estos sistemas en WinoBias sin afectar significativamente su rendimiento en los conjuntos de datos de referencia de correferencia existentes. Nuestro conjunto de datos y código están disponibles en http://winobias.org.
detalles
cita
@inproceedings{zhao2018gender,
title = {Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods},
author = {Zhao, Jieyu and Wang, Tianlu and Yatskar, Mark and Ordonez, Vicente and Chang, Kai-Wei},
year = {2018},
booktitle = {North American Chapter of the Association for Computational Linguistics. NAACL 2018},
url = {https://arxiv.org/abs/1804.06876},
}