Gender Bias in Contextualized Word Embeddings

Jieyu Zhao; Tianlu Wang; Mark Yatskar; Ryan Cotterell; Vicente Ordonez; Kai-Wei Chang

publication

Gender Bias in Contextualized Word Embeddings

Jieyu Zhao, Tianlu Wang, Mark Yatskar, Ryan Cotterell, Vicente Ordonez, Kai-Wei Chang.

North American Chapter of the Association for Computational Linguistics. NAACL 2019. short. Minneapolis, Minnesota. June 2019.

статья pdf исходный bibtex

Новостная редакция лаборатории

Краткое изложение пресс-релиза

Этот раздел намеренно написан в стиле журналистского пресс-релиза для широкой аудитории.

Исследователи из UCLA, University of Virginia, Allen Institute for Artificial Intelligence и University of Cambridge обнаружили, что ELMo — широко используемая система генерации контекстно-зависимых представлений слов в обработке естественного языка — кодирует значимую гендерную предвзятость, которая распространяется вниз по конвейеру в практические приложения. Команда отчасти проследила проблему до перекошенных обучающих данных: в корпусе One Billion Word Benchmark, использованном для обучения ELMo, мужские местоимения встречаются примерно втрое чаще женских, и мужские местоимения чаще соседствуют с профессиональными терминами вне зависимости от того, считаются ли эти профессии традиционно мужскими или женскими. С помощью метода главных компонент исследователи показали, что внутренняя геометрия ELMo на самом деле улавливает гендер по двум различным измерениям — одно связано с окружающим контекстом, другое — с самим словом, — и что классификатор может предсказать гендер мужской сущности по слову-профессии примерно на 14 процентных пунктов точнее, чем гендер женской сущности, что является признаком того, что модель обращается с двумя гендерами неравномерно. Когда современную систему разрешения кореференции, построенную на ELMo, протестировали на WinoBias — диагностическом наборе данных, призванном проверять профессиональные гендерные стереотипы, — она показала разрыв почти в 30 процентных пунктов между точностью на гендерно-стереотипных и гендерно-контрстереотипных примерах — существенно хуже, чем у сопоставимой системы, использующей более старые, неконтекстуализированные эмбеддинги GloVe. Команда испытала два средства: дополнение обучающих данных путём замены гендерных слов для создания сбалансированных примеров в значительной мере устранило предвзятость, тогда как более простой подход на этапе тестирования — усреднение эмбеддингов из предложений с заменённым гендером — сработал лишь частично. Эти выводы важны, поскольку контекстуализированные эмбеддинги, такие как ELMo и BERT, всё чаще становятся основой промышленных NLP-систем, а значит, неисследованная предвзятость в этих фундаментальных компонентах может незаметно распространяться в реальные инструменты.

аннотация

В этой статье мы количественно оцениваем, анализируем и смягчаем гендерную предвзятость, проявляющуюся в контекстуализированных векторах слов ELMo. Сначала мы проводим несколько внутренних анализов и обнаруживаем, что (1) обучающие данные для ELMo содержат значительно больше мужских, чем женских сущностей, (2) обученные эмбеддинги ELMo систематически кодируют гендерную информацию и (3) ELMo неравномерно кодирует гендерную информацию о мужских и женских сущностях. Затем мы показываем, что современная система разрешения кореференции, зависящая от ELMo, наследует его предвзятость и демонстрирует значительную предвзятость на пробном корпусе WinoBias. Наконец, мы исследуем два метода смягчения такой гендерной предвзятости и показываем, что предвзятость, проявляемую на WinoBias, можно устранить.

цитирование

@inproceedings{zhao2019gender,
  title = {Gender Bias in Contextualized Word Embeddings},
  author = {Zhao, Jieyu and Wang, Tianlu and Yatskar, Mark and Cotterell, Ryan and Ordonez, Vicente and Chang, Kai-Wei},
  year = {2019},
  booktitle = {North American Chapter of the Association for Computational Linguistics. NAACL 2019},
  url = {https://arxiv.org/abs/1904.03310},
}