Gender Bias in Contextualized Word Embeddings

Jieyu Zhao; Tianlu Wang; Mark Yatskar; Ryan Cotterell; Vicente Ordonez; Kai-Wei Chang

publication

Gender Bias in Contextualized Word Embeddings

Jieyu Zhao, Tianlu Wang, Mark Yatskar, Ryan Cotterell, Vicente Ordonez, Kai-Wei Chang.

North American Chapter of the Association for Computational Linguistics. NAACL 2019. short. Minneapolis, Minnesota. June 2019.

artículo pdf bibtex sin formato

Mesa de noticias del laboratorio

Resumen de prensa

Esta sección está escrita intencionadamente con un tono de nota de prensa, en estilo periodístico, para el público general.

Investigadores de UCLA, la Universidad de Virginia, el Allen Institute for Artificial Intelligence y la Universidad de Cambridge han descubierto que ELMo, un sistema ampliamente utilizado para generar representaciones de palabras conscientes del contexto en el procesamiento del lenguaje natural, codifica un sesgo de género significativo que fluye hacia aplicaciones prácticas posteriores. El equipo rastreó el problema en parte hasta datos de entrenamiento sesgados: en el corpus One Billion Word Benchmark usado para entrenar ELMo, los pronombres masculinos aparecen aproximadamente tres veces más a menudo que los pronombres femeninos, y los pronombres masculinos co-ocurren con mayor frecuencia con términos ocupacionales, independientemente de si esos trabajos son tradicionalmente masculinos o femeninos. Usando análisis de componentes principales, los investigadores mostraron que la geometría interna de ELMo en realidad captura el género a lo largo de dos dimensiones distintas — una ligada al contexto circundante, otra ligada a la palabra en sí — y que un clasificador puede predecir el género de una entidad masculina a partir de una palabra de ocupación con aproximadamente 14 puntos porcentuales más de precisión que el de una entidad femenina, una señal de que el modelo trata a ambos géneros de forma desigual. Cuando un sistema de resolución de coreferencia del estado del arte construido sobre ELMo se evaluó en WinoBias, un conjunto de datos de diagnóstico diseñado para sondear los estereotipos de género ocupacionales, mostró una brecha de casi 30 puntos porcentuales entre su precisión en ejemplos de género estereotípico frente a los de género contraestereotípico — sustancialmente peor que un sistema comparable que usa los embeddings GloVe, más antiguos y no contextualizados. El equipo probó dos remedios: aumentar los datos de entrenamiento intercambiando palabras con género para crear ejemplos equilibrados eliminó en gran medida el sesgo, mientras que un enfoque más simple en tiempo de prueba consistente en promediar embeddings de oraciones con el género intercambiado solo funcionó parcialmente. Los hallazgos son relevantes porque los embeddings contextualizados como ELMo y BERT son cada vez más la base de los sistemas de PLN de producción, lo que significa que los sesgos no examinados en estos componentes fundamentales pueden propagarse silenciosamente a herramientas del mundo real.

resumen

En este artículo, cuantificamos, analizamos y mitigamos el sesgo de género exhibido en los vectores de palabras contextualizados de ELMo. Primero, realizamos varios análisis intrínsecos y encontramos que (1) los datos de entrenamiento de ELMo contienen significativamente más entidades masculinas que femeninas, (2) los embeddings de ELMo entrenados codifican sistemáticamente información de género y (3) ELMo codifica de forma desigual la información de género sobre entidades masculinas y femeninas. Luego, mostramos que un sistema de coreferencia del estado del arte que depende de ELMo hereda su sesgo y demuestra un sesgo significativo en el corpus de sondeo WinoBias. Finalmente, exploramos dos métodos para mitigar dicho sesgo de género y mostramos que el sesgo demostrado en WinoBias puede eliminarse.

cita

@inproceedings{zhao2019gender,
  title = {Gender Bias in Contextualized Word Embeddings},
  author = {Zhao, Jieyu and Wang, Tianlu and Yatskar, Mark and Cotterell, Ryan and Ordonez, Vicente and Chang, Kai-Wei},
  year = {2019},
  booktitle = {North American Chapter of the Association for Computational Linguistics. NAACL 2019},
  url = {https://arxiv.org/abs/1904.03310},
}