Variation of Gender Biases in Visual Recognition Models Before and After Finetuning
Sintesi del comunicato stampa
I ricercatori della USC, della Columbia, di Meta AI e della Rice University hanno sviluppato un framework per tracciare come i bias di genere incorporati nei popolari modelli di computer vision preaddestrati si comportano quando tali modelli vengono sottoposti a fine-tuning per specifici task a valle — una domanda che ha ricevuto sorprendentemente poca attenzione sistematica nonostante la diffusione con cui questi modelli preaddestrati vengono riutilizzati nell'industria e nel mondo accademico. Il team ha costruito insiemi curati di immagini di riferimento tratte dai dataset COCO e OpenImages, abbinando oggetti di uso quotidiano come tavole da surf e automobili a immagini di uomini e donne, per poi misurare quanto strettamente le rappresentazioni interne delle feature di un modello raggruppassero quelle immagini di oggetti con un genere piuttosto che con l'altro, sia prima sia dopo il fine-tuning. Testando sei modelli pronti all'uso — tra cui varianti di ResNet, CLIP, MoCo e SimCLR — su diverse architetture, dimensioni dei dataset di addestramento e regimi di addestramento supervisionati rispetto ad auto-supervisionati, i ricercatori hanno riscontrato tre pattern degni di nota: i modelli supervisionati su dataset su larga scala come ImageNet-21k tendevano a trasportare ostinatamente i loro bias di preaddestramento in qualunque nuovo task fossero sottoposti a fine-tuning; il fine-tuning su un dataset target più grande come OpenImages aveva maggiori probabilità di introdurre nuove associazioni con bias rispetto al fine-tuning su uno più piccolo come COCO; e i modelli auto-supervisionati, in particolare MoCo, mostravano una minore ritenzione di bias rispetto alle loro controparti supervisionate, sebbene ciò non fosse universale. Per quantificare queste dinamiche, il team ha introdotto una metrica chiamata Bias Transfer Score, basata sulla correlazione per ranghi di Spearman, che misura quanto le associazioni legate ai bias di un modello si spostino tra le fasi di preaddestramento e di fine-tuning. Il lavoro è praticamente significativo perché molti sviluppatori adottano i modelli preaddestrati come scatole nere senza alcuna visibilità su quali bias sociali potrebbero importare silenziosamente nelle loro applicazioni.
abstract
Introduciamo un framework per misurare come cambiano i bias prima e dopo il fine-tuning di un modello di riconoscimento visivo su larga scala per un task a valle. È noto che i modelli di deep learning addestrati su quantità crescenti di dati codificano bias sociali. Molti sistemi di computer vision oggi si affidano a modelli tipicamente preaddestrati su dataset su larga scala. Sebbene siano state sviluppate tecniche di mitigazione dei bias per adattare i modelli ai task a valle, attualmente non è chiaro quali siano gli effetti dei bias già codificati in un modello preaddestrato. Il nostro framework incorpora insiemi di immagini canoniche che rappresentano singoli concetti e coppie di concetti per evidenziare i cambiamenti nei bias per una serie di modelli preaddestrati pronti all'uso, al variare delle dimensioni del modello, delle dimensioni del dataset e degli obiettivi di addestramento. Attraverso le nostre analisi, riscontriamo che (1) i modelli supervisionati addestrati su dataset come ImageNet-21k hanno maggiori probabilità di mantenere i bias del preaddestramento indipendentemente dal dataset target rispetto ai modelli auto-supervisionati. Riscontriamo inoltre che (2) i modelli sottoposti a fine-tuning su dataset di scala maggiore hanno maggiori probabilità di introdurre nuove associazioni con bias. I nostri risultati suggeriscono anche che (3) i bias possono trasferirsi ai modelli sottoposti a fine-tuning e che l'obiettivo e il dataset di fine-tuning possono influenzare l'entità dei bias trasferiti.
dettagli
citazione
@inproceedings{ranjit2023variation,
title = {Variation of Gender Biases in Visual Recognition Models Before and After Finetuning},
author = {Ranjit, Jaspreet and Wang, Tianlu and Ray, Baishakhi and Ordonez, Vicente},
year = {2023},
booktitle = {Workshop on Algorithmic Fairness through the Lens of Time at NeuRIPS 2023},
url = {https://arxiv.org/abs/2303.07615},
}