Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation

Tianlu Wang; Xi Victoria Lin; Nazneen Fatema Rajani; Bryan McCann; Vicente Ordonez; Caiming Xiong

← 論文一覧に戻る

publication

Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation

Tianlu Wang, Xi Victoria Lin, Nazneen Fatema Rajani, Bryan McCann, Vicente Ordonez, Caiming Xiong.

Association for Computational Linguistics. ACL 2020. July 2020.

論文 pdf 生の bibtex

研究室ニュースデスク

プレスリリース要約

このセクションは、一般の読者向けに、意図的に報道発表（記者）スタイルの文体で書かれています。

バージニア大学とSalesforce Researchの研究者らは、単語埋め込みから性別バイアスを除去する一般的な手法を損なう、これまで見過ごされてきた要因、すなわち訓練データにおける単語の統計的頻度を特定した。数えきれないほどのAIや自然言語処理の応用で用いられる言語の数値表現である単語埋め込みは、「プログラマー」を男性と、「主婦」を女性と結びつけるといった、社会的な性別ステレオタイプを符号化することが知られている。この問題に対する主流の解決策であるHard Debiasと呼ばれるアルゴリズムは、埋め込み空間から「性別の方向」を特定して射影によって除去することで機能するが、研究者らは、埋め込みに焼き付けられた単語頻度の情報が、その性別の方向をきれいに除去できる前に歪めてしまうことを発見した。これに対処するため、彼らはDouble-Hard Debiasと呼ばれる2段階の手法を構築した。これはまず埋め込みの頻度に関連する成分を取り除き、その後に標準的なHard Debiasの手順を適用するものである。共参照解析タスク、単語連想テスト、クラスタリングに基づく幾何学的チェックを含む3つの標準的なバイアスベンチマークでGloVeとWord2Vecの埋め込みをテストしたところ、彼らのアプローチは従来の手法よりも測定可能な性別バイアスを大幅に低減し、共参照システムが性別ステレオタイプ的な文と反ステレオタイプ的な文でどれだけうまく機能するかの差は、未修正のGloVeでの15.2パーセントポイントから彼らの手法ではわずか0.9にまで縮小し、その一方で単語アナロジーやカテゴリ化タスクにおける一般的な言語品質はおおむね損なわれずに保たれた。この研究は、単語埋め込みの浄化には、コーパスの統計が残す構造的なアーティファクトにより注意を払う必要があることを示唆している。

要旨

人間が生成したコーパスから導かれる単語埋め込みは強い性別バイアスを継承しており、それは下流のモデルによってさらに増幅されうる。先駆的なHard Debiasアルゴリズムを含む、一般的に採用されているいくつかのバイアス除去アプローチは、事前学習済みの単語埋め込みを推定された性別部分空間に直交する部分空間へ射影する後処理手順を適用する。我々は、単語埋め込みに捉えられた単語頻度のような意味に依存しないコーパスの規則性が、これらのアルゴリズムの性能に悪影響を及ぼすことを発見した。我々は、性別部分空間を推定して除去する前にそのようなコーパスの規則性に対して単語埋め込みを浄化する、単純だが効果的な手法であるDouble Hard Debiasを提案する。3つのバイアス緩和ベンチマークでの実験により、本アプローチが事前学習済み単語埋め込みの分布的意味を保持しつつ、従来のアプローチよりも著しく大きな度合いで性別バイアスを低減することを示す。

詳細

コメント: Accepted to ACL 2020

引用

@inproceedings{wang2020double,
  title = {Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation},
  author = {Wang, Tianlu and Lin, Xi Victoria and Rajani, Nazneen Fatema and McCann, Bryan and Ordonez, Vicente and Xiong, Caiming},
  year = {2020},
  booktitle = {Association for Computational Linguistics. ACL 2020},
  url = {https://arxiv.org/abs/2005.00965},
}