Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods
Tóm tắt thông cáo báo chí
Các nhà nghiên cứu tại UCLA, University of Virginia, và Allen Institute for Artificial Intelligence đã phát hiện ra rằng các hệ thống giải quyết đồng tham chiếu được sử dụng rộng rãi — phần mềm xác định khi nào các từ khác nhau trong một câu cùng chỉ về một người hay một vật — phản ánh một cách có hệ thống các khuôn mẫu giới tính theo những cách có thể gây hại cho con người trong các ứng dụng thực tế. Để đo lường vấn đề, nhóm nghiên cứu đã xây dựng một tập dữ liệu kiểm thử mới tên là WinoBias, gồm 3.160 câu ghép các nghề nghiệp với các đại từ chỉ giới tính theo những cách mà về mặt logic không nên ảnh hưởng đến việc đại từ chỉ về người nào — nhưng thường lại có ảnh hưởng. Khi họ chạy ba hệ thống đồng tham chiếu đã được thiết lập qua WinoBias, cả ba đều hoạt động tốt hơn rõ rệt khi các đại từ khớp với kỳ vọng theo khuôn mẫu giới tính (chẳng hạn liên kết "cô ấy" với "y tá") so với khi chúng đi ngược lại, với khoảng cách hiệu năng trung bình là 21.1 điểm trên thang điểm F1. Các nhà nghiên cứu truy phần lớn thiên kiến này về kho ngữ liệu huấn luyện OntoNotes, nơi hơn 80 phần trăm các thực thể được nhắc đến bằng đại từ chỉ giới tính là nam giới, và về các word embedding mã hóa các liên kết theo khuôn mẫu. Để chống lại điều này, họ đã phát triển một kỹ thuật bổ sung dữ liệu sinh ra một phiên bản đối xứng gương của dữ liệu huấn luyện bằng cách hoán đổi tất cả các tham chiếu nam và nữ, và kết hợp nó với các phương pháp hiện có để khử thiên kiến word embedding. Sự kết hợp đó đã khép lại hiệu quả khoảng cách hiệu năng trên WinoBias mà không làm tổn hại đáng kể đến độ chính xác trên các benchmark tiêu chuẩn — một kết quả quan trọng vì giải quyết đồng tham chiếu được đưa vào một loạt các công nghệ ngôn ngữ hạ nguồn, nghĩa là thiên kiến không được kiểm soát trong các hệ thống này có thể âm thầm lan truyền qua nhiều ứng dụng.
tóm tắt
Chúng tôi giới thiệu một benchmark mới, WinoBias, cho việc giải quyết đồng tham chiếu (coreference resolution) tập trung vào thiên kiến giới tính. Kho ngữ liệu của chúng tôi chứa các câu theo phong cách Winograd-schema với các thực thể tương ứng với những người được nhắc đến bằng nghề nghiệp của họ (ví dụ y tá, bác sĩ, thợ mộc). Chúng tôi chứng minh rằng một hệ thống đồng tham chiếu dựa trên luật, một hệ thống giàu đặc trưng, và một hệ thống nơ-ron đều liên kết các đại từ chỉ giới tính với các thực thể theo khuôn mẫu (pro-stereotypical) với độ chính xác cao hơn so với các thực thể chống khuôn mẫu (anti-stereotypical), với mức chênh lệch trung bình 21.1 điểm F1. Cuối cùng, chúng tôi minh chứng một cách tiếp cận bổ sung dữ liệu mà, kết hợp với các kỹ thuật khử thiên kiến word-embedding hiện có, loại bỏ thiên kiến được thể hiện bởi các hệ thống này trong WinoBias mà không ảnh hưởng đáng kể đến hiệu năng của chúng trên các tập dữ liệu benchmark đồng tham chiếu hiện có. Tập dữ liệu và mã nguồn của chúng tôi có sẵn tại http://winobias.org.
chi tiết
trích dẫn
@inproceedings{zhao2018gender,
title = {Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods},
author = {Zhao, Jieyu and Wang, Tianlu and Yatskar, Mark and Ordonez, Vicente and Chang, Kai-Wei},
year = {2018},
booktitle = {North American Chapter of the Association for Computational Linguistics. NAACL 2018},
url = {https://arxiv.org/abs/1804.06876},
}