Gender Bias in Contextualized Word Embeddings
publication

Gender Bias in Contextualized Word Embeddings

Jieyu Zhao, Tianlu Wang, Mark Yatskar, Ryan Cotterell, Vicente Ordonez, Kai-Wei Chang.
North American Chapter of the Association for Computational Linguistics. NAACL 2019. short. Minneapolis, Minnesota. June 2019.
Bàn tin tức của phòng thí nghiệm

Tóm tắt thông cáo báo chí

Phần này được viết có chủ đích theo giọng văn thông cáo báo chí kiểu nhà báo, dành cho độc giả phổ thông.

Các nhà nghiên cứu từ UCLA, University of Virginia, Allen Institute for Artificial Intelligence và University of Cambridge đã phát hiện rằng ELMo, một hệ thống được sử dụng rộng rãi để tạo các biểu diễn từ nhận biết ngữ cảnh trong xử lý ngôn ngữ tự nhiên, mã hóa thiên kiến giới tính đáng kể, vốn lan truyền xuống các ứng dụng thực tế ở hạ nguồn. Nhóm nghiên cứu truy nguyên vấn đề một phần từ dữ liệu huấn luyện bị lệch: trong kho ngữ liệu One Billion Word Benchmark được dùng để huấn luyện ELMo, các đại từ nam xuất hiện thường xuyên gấp khoảng ba lần đại từ nữ, và các đại từ nam đồng xuất hiện thường xuyên hơn với các thuật ngữ nghề nghiệp bất kể những nghề đó theo truyền thống là dành cho nam hay nữ. Sử dụng phân tích thành phần chính (principal component analysis), các nhà nghiên cứu cho thấy rằng hình học nội tại của ELMo thực ra nắm bắt giới tính theo hai chiều riêng biệt — một chiều gắn với ngữ cảnh xung quanh, một chiều gắn với chính từ đó — và rằng một bộ phân loại có thể dự đoán giới tính của một thực thể nam từ một từ nghề nghiệp chính xác hơn khoảng 14 điểm phần trăm so với một thực thể nữ, một dấu hiệu cho thấy mô hình xử lý hai giới tính một cách không đồng đều. Khi một hệ thống phân giải đồng tham chiếu tốt nhất hiện nay được xây dựng trên ELMo được thử nghiệm trên WinoBias, một bộ dữ liệu chẩn đoán được thiết kế để thăm dò các khuôn mẫu giới tính nghề nghiệp, nó cho thấy một khoảng cách gần 30 điểm phần trăm giữa độ chính xác của nó trên các ví dụ theo khuôn mẫu giới tính so với các ví dụ ngược khuôn mẫu giới tính — tệ hơn đáng kể so với một hệ thống tương đương sử dụng các embedding GloVe cũ hơn, không được ngữ cảnh hóa. Nhóm đã thử nghiệm hai biện pháp khắc phục: tăng cường dữ liệu huấn luyện bằng cách hoán đổi các từ mang giới tính để tạo ra các ví dụ cân bằng đã loại bỏ phần lớn thiên kiến, trong khi một cách tiếp cận đơn giản hơn tại thời điểm kiểm tra là lấy trung bình các embedding từ các câu đã hoán đổi giới tính chỉ có tác dụng một phần. Các phát hiện này quan trọng vì các embedding được ngữ cảnh hóa như ELMo và BERT ngày càng trở thành xương sống của các hệ thống NLP trong sản xuất, nghĩa là các thiên kiến chưa được xem xét trong những thành phần nền tảng này có thể âm thầm lan truyền vào các công cụ trong thế giới thực.

tóm tắt

Trong bài báo này, chúng tôi định lượng, phân tích và giảm thiểu thiên kiến giới tính được thể hiện trong các vector từ được ngữ cảnh hóa của ELMo. Trước tiên, chúng tôi thực hiện một số phân tích nội tại và nhận thấy rằng (1) dữ liệu huấn luyện cho ELMo chứa nhiều thực thể nam giới hơn đáng kể so với nữ giới, (2) các embedding ELMo đã huấn luyện mã hóa thông tin giới tính một cách có hệ thống, và (3) ELMo mã hóa thông tin giới tính về các thực thể nam và nữ một cách không đồng đều. Sau đó, chúng tôi cho thấy rằng một hệ thống đồng tham chiếu (coreference) tốt nhất hiện nay phụ thuộc vào ELMo đã kế thừa thiên kiến của nó và thể hiện thiên kiến đáng kể trên kho ngữ liệu thăm dò WinoBias. Cuối cùng, chúng tôi khám phá hai phương pháp để giảm thiểu thiên kiến giới tính như vậy và cho thấy rằng thiên kiến được thể hiện trên WinoBias có thể bị loại bỏ.

trích dẫn

@inproceedings{zhao2019gender,
  title = {Gender Bias in Contextualized Word Embeddings},
  author = {Zhao, Jieyu and Wang, Tianlu and Yatskar, Mark and Cotterell, Ryan and Ordonez, Vicente and Chang, Kai-Wei},
  year = {2019},
  booktitle = {North American Chapter of the Association for Computational Linguistics. NAACL 2019},
  url = {https://arxiv.org/abs/1904.03310},
}