Balanced Datasets Are Not Enough: Estimating and Mitigating Gender Bias in Deep Image Representations
Sintesi del comunicato stampa
I ricercatori della University of Virginia, della UCLA e dell'Allen Institute for Artificial Intelligence hanno scoperto che il semplice bilanciamento dei dataset di addestramento non basta a impedire ai sistemi di riconoscimento di immagini dell'IA di amplificare gli stereotipi di genere. Il team ha studiato modelli addestrati su due dataset ampiamente utilizzati — COCO, che etichetta oggetti di uso quotidiano, e imSitu, che etichetta azioni umane — e ha riscontrato che, anche quando ribilanciava artificialmente i dati in modo che uomini e donne comparissero con la stessa frequenza accanto a ciascuna etichetta di categoria, i modelli addestrati continuavano ad apprendere ad associare il genere a quelle categorie a tassi gonfiati all'incirca uguali a quelli dei modelli addestrati sui dati originali distorti. Per misurare questo problema con maggiore precisione, i ricercatori hanno sviluppato due nuove metriche che chiamano "dataset leakage" e "model leakage", che quantificano con quanta accuratezza un osservatore esterno potrebbe indovinare il genere di una persona in un'immagine semplicemente osservando quali etichette un modello le assegna; il divario tra queste due misure cattura quanta informazione di genere aggiuntiva il modello stia introducendo nelle proprie previsioni oltre a quanto contenuto nei dati stessi. La loro spiegazione del perché il bilanciamento fallisca è diretta: i dataset contengono innumerevoli indizi visivi non etichettati — come la presenza di bambini, gli stili di abbigliamento o la postura del corpo — che correlano con il genere e non possono essere neutralizzati regolando soltanto il conteggio delle etichette. Per ridurre effettivamente il pregiudizio, il team ha addestrato i modelli con una componente avversaria che penalizza attivamente la rete per la codifica di caratteristiche predittive del genere nei suoi strati intermedi, ottenendo una riduzione dell'amplificazione del pregiudizio dal 53 al 67 percento sacrificando solo circa uno o due punti percentuali di accuratezza nella classificazione. Il lavoro è un monito per chiunque presuma che l'equità demografica nell'IA possa essere raggiunta tramite la sola cura dei dataset, e indica negli interventi architetturali più profondi una via più affidabile da percorrere.
abstract
In questo lavoro presentiamo un framework per misurare e mitigare i pregiudizi intrinseci rispetto a variabili protette — come il genere — nei compiti di riconoscimento visivo. Mostriamo che i modelli addestrati amplificano in modo significativo l'associazione tra le etichette obiettivo e il genere, oltre quanto ci si aspetterebbe da dataset di per sé sbilanciati. Sorprendentemente, mostriamo che anche quando i dataset sono bilanciati in modo tale che ciascuna etichetta co-occorra in egual misura con ciascun genere, i modelli appresi amplificano l'associazione tra etichette e genere tanto quanto se i dati non fossero stati bilanciati! Per mitigare ciò, adottiamo un approccio avversario per rimuovere dalle rappresentazioni intermedie di una rete neurale profonda le caratteristiche indesiderate corrispondenti alle variabili protette — e forniamo un'analisi dettagliata della sua efficacia. Esperimenti su due dataset: il dataset COCO (oggetti) e il dataset imSitu (azioni) mostrano riduzioni nell'amplificazione del pregiudizio di genere pur mantenendo gran parte dell'accuratezza dei modelli originali.
dettagli
citazione
@inproceedings{wang2019balanced,
title = {Balanced Datasets Are Not Enough: Estimating and Mitigating Gender Bias in Deep Image Representations},
author = {Wang, Tianlu and Zhao, Jieyu and Yatskar, Mark and Chang, Kai-Wei and Ordonez, Vicente},
year = {2019},
booktitle = {International Conference on Computer Vision. ICCV 2019},
url = {https://arxiv.org/abs/1811.08489},
}