Towards Understanding Gender-Seniority Compound Bias in Natural Language Generation.

Samhita Honnavalli; Aesha Parekh; Lily Ou; Sophie Groenwold; Sharon Levy; Vicente Ordonez; William Yang Wang

← quay lại danh sách công bố

publication

Towards Understanding Gender-Seniority Compound Bias in Natural Language Generation.

Samhita Honnavalli, Aesha Parekh, Lily Ou, Sophie Groenwold, Sharon Levy, Vicente Ordonez, William Yang Wang.

Language Resources and Evaluation Conference LREC 2022.

bài báo pdf bibtex thô

Bàn tin tức của phòng thí nghiệm

Tóm tắt thông cáo báo chí

Phần này được viết có chủ đích theo giọng văn thông cáo báo chí kiểu nhà báo, dành cho độc giả phổ thông.

Các nhà nghiên cứu từ UC Santa Barbara và Rice University đã phát hiện ra rằng GPT-2, một trong những mô hình tạo văn bản được sử dụng rộng rãi nhất, ghép phụ nữ với các chức danh công việc cấp thấp hơn và đàn ông với các chức danh cao hơn một cách có hệ thống — và rằng xu hướng này trở nên tồi tệ hơn khi các tín hiệu về thâm niên được thêm vào một lời nhắc. Để nghiên cứu vấn đề, nhóm đã xây dựng một bộ dữ liệu gồm các đoạn văn bản từ thực tế rút từ các kết quả tìm kiếm Google bao phủ hai lĩnh vực chuyên môn: các thượng nghị sĩ Hoa Kỳ và các giáo sư khoa học máy tính. Sau đó họ tạo ra các phiên bản "phản thực" được ghép cặp của mỗi đoạn bằng cách hoán đổi hoặc nhãn giới tính hoặc nhãn thâm niên, cho phép họ đo lường mức độ tự tin của mô hình thay đổi như thế nào tùy thuộc vào tổ hợp nào nó nhìn thấy. Trong một bài kiểm tra perplexity — về cơ bản là hỏi GPT-2 ngạc nhiên đến mức nào trước một câu cho trước — mô hình liên tục thấy ít hợp lý hơn khi một phụ nữ giữ một chức danh cấp cao so với khi một đàn ông giữ chức đó, trong khi điều ngược lại đúng với các chức danh cấp thấp. Trong một thí nghiệm thứ hai, nhóm đã cung cấp cho mô hình các lời nhắc trung lập về giới chỉ khác nhau về cách diễn đạt thâm niên và để các người chấm điểm con người phân loại giới tính của ngôn ngữ mà GPT-2 tạo ra để đáp lại; mô hình tạo ra văn bản mang giới tính nam thường xuyên hơn nhiều so với mức mà nhân khẩu học thực tế của các thượng nghị sĩ hoặc giáo sư có thể biện minh, và khoảng cách nới rộng ra khi từ "senior" xuất hiện trong lời nhắc. Các phát hiện có ý nghĩa bởi GPT-2 và các mô hình tương tự làm nền tảng cho các công cụ như các bộ sàng lọc hồ sơ và các chatbot nhân sự, nghĩa là các thiên kiến giới-và-thâm niên kết hợp này có thể chuyển hóa trực tiếp thành các cơ hội nghề nghiệp bất bình đẳng cho phụ nữ.

tóm tắt

Phụ nữ thường được nhìn nhận là cấp dưới so với những người đồng nghiệp nam của họ, ngay cả trong cùng một chức danh công việc. Mặc dù đã có tiến bộ đáng kể trong việc đánh giá thiên kiến giới trong xử lý ngôn ngữ tự nhiên (NLP), các nghiên cứu hiện có hiếm khi điều tra cách các thiên kiến đối với các nhóm giới thay đổi như thế nào khi kết hợp với các thiên kiến xã hội khác. Trong công trình này, chúng tôi điều tra cách thâm niên tác động đến mức độ thiên kiến giới được thể hiện trong các mô hình sinh nơ-ron được tiền huấn luyện bằng cách giới thiệu một khung mới để thăm dò thiên kiến kết hợp. Chúng tôi đóng góp một bộ dữ liệu kiểm tra tính bền vững làm benchmark trải dài hai lĩnh vực, chức thượng nghị sĩ Hoa Kỳ và chức giáo sư, được tạo ra bằng một phương pháp giám sát từ xa. Bộ dữ liệu của chúng tôi bao gồm văn bản do con người viết với chân lý nền tảng ẩn bên dưới và các phản thực được ghép cặp. Sau đó chúng tôi xem xét perplexity của GPT-2 và tần suất của ngôn ngữ mang giới tính trong văn bản được tạo ra. Kết quả của chúng tôi cho thấy rằng GPT-2 khuếch đại thiên kiến bằng cách coi phụ nữ là cấp dưới và đàn ông là cấp trên thường xuyên hơn so với chân lý nền tảng trong cả hai lĩnh vực. Những kết quả này gợi ý rằng các ứng dụng NLP được xây dựng bằng GPT-2 có thể gây hại cho phụ nữ trong các vai trò chuyên môn.

chi tiết

ghi chú: 6 pages, LREC 2022

trích dẫn

@inproceedings{honnavalli2022towards,
  title = {Towards Understanding Gender-Seniority Compound Bias in Natural Language Generation.},
  author = {Honnavalli, Samhita and Parekh, Aesha and Ou, Lily and Groenwold, Sophie and Levy, Sharon and Ordonez, Vicente and Wang, William Yang},
  year = {2022},
  booktitle = {Language Resources and Evaluation Conference LREC 2022},
  url = {https://arxiv.org/abs/2205.09830},
}