Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods
Sintesi del comunicato stampa
I ricercatori di UCLA, della University of Virginia e dell'Allen Institute for Artificial Intelligence hanno scoperto che i sistemi di risoluzione delle coreferenze ampiamente utilizzati — software che identifica quando parole diverse in una frase si riferiscono alla stessa persona o cosa — riflettono sistematicamente gli stereotipi di genere in modi che potrebbero danneggiare le persone nelle applicazioni reali. Per misurare il problema, il gruppo ha costruito un nuovo dataset di test chiamato WinoBias, composto da 3.160 frasi che abbinano professioni e pronomi connotati per genere in modi che non dovrebbero, logicamente, influenzare a quale persona il pronome si riferisca — ma che spesso lo fanno. Quando hanno fatto elaborare WinoBias a tre sistemi di coreferenza consolidati, tutti e tre hanno ottenuto prestazioni nettamente migliori quando i pronomi corrispondevano alle aspettative stereotipiche di genere (collegando ad esempio "lei" a "infermiera") rispetto a quando vi si opponevano, con un divario di prestazione medio di 21,1 punti sulla scala di punteggio F1. I ricercatori hanno ricondotto gran parte del bias al corpus di addestramento OntoNotes, in cui oltre l'80 percento delle entità indicate da pronomi connotati per genere erano maschili, e agli word embedding che codificano associazioni stereotipiche. Per contrastare questo fenomeno, hanno sviluppato una tecnica di data augmentation che genera una versione speculare dei dati di addestramento scambiando tutti i riferimenti maschili e femminili, e l'hanno combinata con metodi esistenti per il debiasing degli word embedding. Tale combinazione ha effettivamente colmato il divario di prestazione su WinoBias senza compromettere in modo significativo l'accuratezza sui benchmark standard — un risultato importante perché la risoluzione delle coreferenze alimenta un'ampia gamma di tecnologie linguistiche a valle, il che significa che un bias non controllato in questi sistemi può propagarsi silenziosamente attraverso molte applicazioni.
abstract
Introduciamo un nuovo benchmark, WinoBias, per la risoluzione delle coreferenze incentrato sul bias di genere. Il nostro corpus contiene frasi in stile Winograd-schema con entità corrispondenti a persone indicate tramite la loro professione (ad es. l'infermiere, il dottore, il falegname). Dimostriamo che un sistema di coreferenza basato su regole, uno ricco di caratteristiche e uno neurale collegano tutti i pronomi connotati per genere a entità pro-stereotipiche con un'accuratezza maggiore rispetto alle entità anti-stereotipiche, con una differenza media di 21,1 nel punteggio F1. Infine, dimostriamo un approccio di data augmentation che, in combinazione con tecniche esistenti di debiasing degli word embedding, rimuove il bias manifestato da questi sistemi in WinoBias senza influire in modo significativo sulle loro prestazioni sui dataset di benchmark di coreferenza esistenti. Il nostro dataset e il codice sono disponibili all'indirizzo http://winobias.org.
dettagli
citazione
@inproceedings{zhao2018gender,
title = {Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods},
author = {Zhao, Jieyu and Wang, Tianlu and Yatskar, Mark and Ordonez, Vicente and Chang, Kai-Wei},
year = {2018},
booktitle = {North American Chapter of the Association for Computational Linguistics. NAACL 2018},
url = {https://arxiv.org/abs/1804.06876},
}