Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation
publication

Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation

Tianlu Wang, Xi Victoria Lin, Nazneen Fatema Rajani, Bryan McCann, Vicente Ordonez, Caiming Xiong.
Association for Computational Linguistics. ACL 2020. July 2020.
연구실 뉴스 데스크

보도 자료 요약

이 섹션은 일반 독자를 위해 의도적으로 기자 보도 자료 형식으로 작성되었습니다.

버지니아 대학교와 Salesforce Research의 연구자들은 단어 임베딩에서 성별 편향을 제거하는 일반적인 기법을 약화시키는 이전에 간과된 요인 — 학습 데이터에서 단어의 통계적 빈도 — 을 식별했다. 수많은 AI 및 자연어 처리 응용에서 사용되는 언어의 수치 표현인 단어 임베딩은 "프로그래머"를 남성과, "주부"를 여성과 연관 짓는 것과 같은 사회적 성별 고정관념을 부호화하는 것으로 알려져 있다. 이 문제에 대한 지배적인 해결책인 Hard Debias라는 알고리즘은 임베딩 공간에서 "성별 방향"을 식별하고 사영해 제거함으로써 작동하는데, 연구자들은 임베딩에 새겨진 단어 빈도 정보가 그 성별 방향을 깔끔하게 제거하기 전에 왜곡한다는 것을 발견했다. 이를 해결하기 위해 그들은 먼저 임베딩의 빈도 관련 성분을 벗겨낸 다음 표준 Hard Debias 절차를 적용하는 Double-Hard Debias라는 2단계 방법을 구축했다. 상호참조 해소 작업, 단어 연상 테스트, 클러스터링 기반 기하 점검을 포함한 세 개의 표준 편향 벤치마크에서 GloVe와 Word2Vec 임베딩에 대해 시험한 결과, 그들의 접근법은 이전 방법보다 측정 가능한 성별 편향을 더 크게 줄였으며, 상호참조 시스템이 성별 고정관념적 문장과 반(反)고정관념적 문장에서 보인 성능의 격차가 수정하지 않은 GloVe에서의 15.2퍼센트 포인트에서 그들의 방법으로는 단 0.9로 떨어졌고, 단어 유추 및 범주화 작업에서의 일반적인 언어 품질은 대체로 손상되지 않은 채 유지되었다. 이 연구는 단어 임베딩을 정화하려면 코퍼스 통계가 남기는 구조적 아티팩트에 더 면밀히 주의를 기울여야 함을 시사한다.

초록

인간이 생성한 코퍼스에서 도출된 단어 임베딩은 강한 성별 편향을 물려받으며, 이는 다운스트림 모델에 의해 더욱 증폭될 수 있다. 선구적인 Hard Debias 알고리즘을 포함하여 일반적으로 채택되는 일부 편향 제거 접근법은 사전학습된 단어 임베딩을 추론된 성별 부분공간에 직교하는 부분공간으로 사영하는 후처리 절차를 적용한다. 우리는 단어 임베딩에 포착된 단어 빈도와 같은 의미와 무관한 코퍼스 규칙성이 이러한 알고리즘의 성능에 부정적인 영향을 미친다는 것을 발견했다. 우리는 성별 부분공간을 추론하고 제거하기 전에 그러한 코퍼스 규칙성에 대해 단어 임베딩을 정화하는 간단하지만 효과적인 기법인 Double Hard Debias를 제안한다. 세 개의 편향 완화 벤치마크에 대한 실험은 우리의 접근법이 사전학습된 단어 임베딩의 분포적 의미를 보존하는 동시에 이전 접근법보다 훨씬 더 큰 정도로 성별 편향을 줄임을 보여준다.

세부 정보

비고
Accepted to ACL 2020

인용

@inproceedings{wang2020double,
  title = {Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation},
  author = {Wang, Tianlu and Lin, Xi Victoria and Rajani, Nazneen Fatema and McCann, Bryan and Ordonez, Vicente and Xiong, Caiming},
  year = {2020},
  booktitle = {Association for Computational Linguistics. ACL 2020},
  url = {https://arxiv.org/abs/2005.00965},
}