Variation of Gender Biases in Visual Recognition Models Before and After Finetuning
publication

Variation of Gender Biases in Visual Recognition Models Before and After Finetuning

Jaspreet Ranjit, Tianlu Wang, Baishakhi Ray, Vicente Ordonez.
Workshop on Algorithmic Fairness through the Lens of Time at NeuRIPS 2023. New Orleans, LA.
Rubrique actualités du laboratoire

Résumé du communiqué de presse

Cette section est volontairement rédigée dans le style d'un communiqué de presse, sur un ton journalistique, à destination du grand public.

Des chercheurs de l'USC, de Columbia, de Meta AI et de Rice University ont mis au point un cadre permettant de suivre comment les biais de genre intégrés dans des modèles de vision par ordinateur pré-entraînés populaires se comportent lorsque ces modèles sont affinés pour des tâches spécifiques en aval — une question qui a reçu étonnamment peu d'attention systématique malgré la large réutilisation de ces modèles pré-entraînés dans l'industrie et le milieu universitaire. L'équipe a constitué des ensembles soigneusement sélectionnés d'images de référence tirées des jeux de données COCO et OpenImages, en associant des objets du quotidien comme des planches de surf et des voitures à des images d'hommes et de femmes, puis a mesuré à quel point les représentations internes des caractéristiques d'un modèle regroupaient ces images d'objets avec un genre plutôt qu'avec l'autre, tant avant qu'après l'affinage. En testant six modèles prêts à l'emploi — dont des variantes de ResNet, CLIP, MoCo et SimCLR — selon différentes architectures, tailles de jeux de données d'entraînement et régimes d'entraînement supervisé ou auto-supervisé, les chercheurs ont relevé trois tendances notables : les modèles supervisés sur des jeux de données à grande échelle comme ImageNet-21k avaient tendance à transporter obstinément leurs biais de pré-entraînement vers toute nouvelle tâche pour laquelle ils étaient affinés ; l'affinage sur un jeu de données cible plus grand comme OpenImages était plus susceptible d'introduire de nouvelles associations biaisées que l'affinage sur un jeu plus petit comme COCO ; et les modèles auto-supervisés, en particulier MoCo, montraient une moindre conservation des biais que leurs homologues supervisés, bien que cela ne fût pas universel. Pour quantifier ces dynamiques, l'équipe a introduit une métrique appelée Bias Transfer Score, fondée sur la corrélation de rang de Spearman, qui mesure dans quelle mesure les associations liées aux biais d'un modèle évoluent entre les étapes de pré-entraînement et d'affinage. Ce travail revêt une importance pratique car de nombreux développeurs adoptent des modèles pré-entraînés comme des boîtes noires, sans visibilité sur les biais sociétaux qu'ils pourraient importer silencieusement dans leurs applications.

résumé

Nous présentons un cadre permettant de mesurer comment les biais évoluent avant et après l'affinage d'un modèle de reconnaissance visuelle à grande échelle pour une tâche en aval. Il est connu que les modèles d'apprentissage profond entraînés sur des quantités croissantes de données encodent des biais sociétaux. De nombreux systèmes de vision par ordinateur reposent aujourd'hui sur des modèles généralement pré-entraînés sur des jeux de données à grande échelle. Bien que des techniques d'atténuation des biais aient été développées pour ajuster les modèles à des tâches en aval, on ignore actuellement quels sont les effets des biais déjà encodés dans un modèle pré-entraîné. Notre cadre intègre des ensembles d'images canoniques représentant des concepts individuels et des paires de concepts afin de mettre en évidence les changements de biais pour un éventail de modèles pré-entraînés prêts à l'emploi, selon les tailles de modèles, les tailles de jeux de données et les objectifs d'entraînement. À travers nos analyses, nous constatons que (1) les modèles supervisés entraînés sur des jeux de données tels qu'ImageNet-21k sont plus susceptibles de conserver leurs biais de pré-entraînement, indépendamment du jeu de données cible, par rapport aux modèles auto-supervisés. Nous constatons également que (2) les modèles affinés sur des jeux de données à plus grande échelle sont plus susceptibles d'introduire de nouvelles associations biaisées. Nos résultats suggèrent également que (3) les biais peuvent se transmettre aux modèles affinés et que l'objectif et le jeu de données d'affinage peuvent influer sur l'ampleur des biais transmis.

détails

commentaire
10 pages, 3 Figures

citation

@inproceedings{ranjit2023variation,
  title = {Variation of Gender Biases in Visual Recognition Models Before and After Finetuning},
  author = {Ranjit, Jaspreet and Wang, Tianlu and Ray, Baishakhi and Ordonez, Vicente},
  year = {2023},
  booktitle = {Workshop on Algorithmic Fairness through the Lens of Time at NeuRIPS 2023},
  url = {https://arxiv.org/abs/2303.07615},
}