Gender Bias in Contextualized Word Embeddings

Jieyu Zhao; Tianlu Wang; Mark Yatskar; Ryan Cotterell; Vicente Ordonez; Kai-Wei Chang

publication

Gender Bias in Contextualized Word Embeddings

Jieyu Zhao, Tianlu Wang, Mark Yatskar, Ryan Cotterell, Vicente Ordonez, Kai-Wei Chang.

North American Chapter of the Association for Computational Linguistics. NAACL 2019. short. Minneapolis, Minnesota. June 2019.

論文 pdf 生の bibtex

研究室ニュースデスク

プレスリリース要約

このセクションは、一般の読者向けに、意図的に報道発表（記者）スタイルの文体で書かれています。

UCLA、バージニア大学、アレン人工知能研究所、ケンブリッジ大学の研究者らは、自然言語処理において文脈を考慮した単語表現を生成する広く使われているシステムであるELMoが、下流の実用的なアプリケーションへと波及する意味のあるジェンダーバイアスをエンコードしていることを発見した。研究チームはこの問題の一因を偏った訓練データにたどった。ELMoの訓練に使われたOne Billion Word Benchmarkコーパスでは、男性代名詞が女性代名詞のおよそ3倍の頻度で出現し、また男性代名詞は、その職業が伝統的に男性的か女性的かにかかわらず、職業に関する用語とより頻繁に共起していた。主成分分析を用いて、研究者らはELMoの内部の幾何構造が実際には2つの異なる次元（一方は周囲の文脈に結びつき、もう一方は単語そのものに結びつく）に沿ってジェンダーを捉えていること、そして分類器が職業を表す単語から男性エンティティのジェンダーを女性エンティティの場合より約14パーセントポイント高い精度で予測できることを示し、モデルが両方のジェンダーを不均等に扱っている兆候を明らかにした。ELMo上に構築された最先端の共参照解析システムを、職業に関するジェンダーのステレオタイプを検証するために設計された診断用データセットWinoBiasで評価したところ、ジェンダーステレオタイプに沿った例と反する例の間で精度に30パーセントポイント近くの差が見られ、これは旧来の文脈非依存のGloVe埋め込みを用いた同等のシステムよりも大幅に悪い結果であった。研究チームは2つの対策を検証した。ジェンダーを表す単語を入れ替えてバランスのとれた例を作る訓練データ拡張はバイアスをおおむね除去したが、ジェンダーを入れ替えた文の埋め込みを平均化するというより単純なテスト時の手法は部分的にしか効果がなかった。ELMoやBERTのような文脈化埋め込みがますます実運用のNLPシステムの基盤となっていることから、こうした基礎的な構成要素における未検証のバイアスが現実世界のツールへひそかに伝播しうるという点で、この知見は重要である。

要旨

本論文では、ELMoの文脈化単語ベクトルに現れるジェンダーバイアスを定量化し、分析し、緩和する。まず、いくつかの内在的分析を行い、(1) ELMoの訓練データには女性よりも男性のエンティティが著しく多く含まれていること、(2) 訓練されたELMo埋め込みがジェンダー情報を体系的にエンコードしていること、(3) ELMoが男性と女性のエンティティに関するジェンダー情報を不均等にエンコードしていることを見いだす。次に、ELMoに依存する最先端の共参照解析システムがそのバイアスを継承し、WinoBias検証コーパス上で著しいバイアスを示すことを明らかにする。最後に、こうしたジェンダーバイアスを緩和する2つの手法を検討し、WinoBias上で示されたバイアスを除去できることを示す。

引用

@inproceedings{zhao2019gender,
  title = {Gender Bias in Contextualized Word Embeddings},
  author = {Zhao, Jieyu and Wang, Tianlu and Yatskar, Mark and Cotterell, Ryan and Ordonez, Vicente and Chang, Kai-Wei},
  year = {2019},
  booktitle = {North American Chapter of the Association for Computational Linguistics. NAACL 2019},
  url = {https://arxiv.org/abs/1904.03310},
}