Balanced Datasets Are Not Enough: Estimating and Mitigating Gender Bias in Deep Image Representations

Tianlu Wang; Jieyu Zhao; Mark Yatskar; Kai-Wei Chang; Vicente Ordonez

← torna alle pubblicazioni

publication

Balanced Datasets Are Not Enough: Estimating and Mitigating Gender Bias in Deep Image Representations

Tianlu Wang, Jieyu Zhao, Mark Yatskar, Kai-Wei Chang, Vicente Ordonez.

International Conference on Computer Vision. ICCV 2019. Seoul, South Korea. October 2019.

articolo code demo pdf bibtex grezzo

Redazione notizie del laboratorio

Sintesi del comunicato stampa

Questa sezione è scritta volutamente con il tono di un comunicato stampa giornalistico, destinato al pubblico generale.

I ricercatori della University of Virginia, della UCLA e dell'Allen Institute for Artificial Intelligence hanno scoperto che il semplice bilanciamento dei dataset di addestramento non basta a impedire ai sistemi di riconoscimento di immagini dell'IA di amplificare gli stereotipi di genere. Il team ha studiato modelli addestrati su due dataset ampiamente utilizzati — COCO, che etichetta oggetti di uso quotidiano, e imSitu, che etichetta azioni umane — e ha riscontrato che, anche quando ribilanciava artificialmente i dati in modo che uomini e donne comparissero con la stessa frequenza accanto a ciascuna etichetta di categoria, i modelli addestrati continuavano ad apprendere ad associare il genere a quelle categorie a tassi gonfiati all'incirca uguali a quelli dei modelli addestrati sui dati originali distorti. Per misurare questo problema con maggiore precisione, i ricercatori hanno sviluppato due nuove metriche che chiamano "dataset leakage" e "model leakage", che quantificano con quanta accuratezza un osservatore esterno potrebbe indovinare il genere di una persona in un'immagine semplicemente osservando quali etichette un modello le assegna; il divario tra queste due misure cattura quanta informazione di genere aggiuntiva il modello stia introducendo nelle proprie previsioni oltre a quanto contenuto nei dati stessi. La loro spiegazione del perché il bilanciamento fallisca è diretta: i dataset contengono innumerevoli indizi visivi non etichettati — come la presenza di bambini, gli stili di abbigliamento o la postura del corpo — che correlano con il genere e non possono essere neutralizzati regolando soltanto il conteggio delle etichette. Per ridurre effettivamente il pregiudizio, il team ha addestrato i modelli con una componente avversaria che penalizza attivamente la rete per la codifica di caratteristiche predittive del genere nei suoi strati intermedi, ottenendo una riduzione dell'amplificazione del pregiudizio dal 53 al 67 percento sacrificando solo circa uno o due punti percentuali di accuratezza nella classificazione. Il lavoro è un monito per chiunque presuma che l'equità demografica nell'IA possa essere raggiunta tramite la sola cura dei dataset, e indica negli interventi architetturali più profondi una via più affidabile da percorrere.

abstract

In questo lavoro presentiamo un framework per misurare e mitigare i pregiudizi intrinseci rispetto a variabili protette — come il genere — nei compiti di riconoscimento visivo. Mostriamo che i modelli addestrati amplificano in modo significativo l'associazione tra le etichette obiettivo e il genere, oltre quanto ci si aspetterebbe da dataset di per sé sbilanciati. Sorprendentemente, mostriamo che anche quando i dataset sono bilanciati in modo tale che ciascuna etichetta co-occorra in egual misura con ciascun genere, i modelli appresi amplificano l'associazione tra etichette e genere tanto quanto se i dati non fossero stati bilanciati! Per mitigare ciò, adottiamo un approccio avversario per rimuovere dalle rappresentazioni intermedie di una rete neurale profonda le caratteristiche indesiderate corrispondenti alle variabili protette — e forniamo un'analisi dettagliata della sua efficacia. Esperimenti su due dataset: il dataset COCO (oggetti) e il dataset imSitu (azioni) mostrano riduzioni nell'amplificazione del pregiudizio di genere pur mantenendo gran parte dell'accuratezza dei modelli originali.

dettagli

commento: 10 pages, 7 figures, ICCV 2019

citazione

@inproceedings{wang2019balanced,
  title = {Balanced Datasets Are Not Enough: Estimating and Mitigating Gender Bias in Deep Image Representations},
  author = {Wang, Tianlu and Zhao, Jieyu and Yatskar, Mark and Chang, Kai-Wei and Ordonez, Vicente},
  year = {2019},
  booktitle = {International Conference on Computer Vision. ICCV 2019},
  url = {https://arxiv.org/abs/1811.08489},
}