Variation of Gender Biases in Visual Recognition Models Before and After Finetuning

Jaspreet Ranjit; Tianlu Wang; Baishakhi Ray; Vicente Ordonez

← volver a publicaciones

publication

Variation of Gender Biases in Visual Recognition Models Before and After Finetuning

Jaspreet Ranjit, Tianlu Wang, Baishakhi Ray, Vicente Ordonez.

Workshop on Algorithmic Fairness through the Lens of Time at NeuRIPS 2023. New Orleans, LA.

artículo code pdf bibtex sin formato

Mesa de noticias del laboratorio

Resumen de prensa

Esta sección está escrita intencionadamente con un tono de nota de prensa, en estilo periodístico, para el público general.

Investigadores de la Universidad del Sur de California, la Universidad de Columbia, Meta AI y la Universidad Rice han desarrollado un marco para rastrear cómo se comportan los sesgos de género incrustados en populares modelos preentrenados de visión por computador cuando esos modelos se ajustan finamente para tareas posteriores específicas, una cuestión que ha recibido sorprendentemente poca atención sistemática a pesar de lo ampliamente que se reutilizan estos modelos preentrenados en la industria y la academia. El equipo construyó conjuntos curados de imágenes de referencia extraídas de los conjuntos de datos COCO y OpenImages, emparejando objetos cotidianos como tablas de surf y coches con imágenes de hombres y mujeres, y luego midió con qué grado las representaciones internas de características de un modelo agrupaban esas imágenes de objetos con un género frente al otro, tanto antes como después del ajuste fino. Al probar seis modelos disponibles —incluyendo variantes de ResNet, CLIP, MoCo y SimCLR— a través de diferentes arquitecturas, tamaños de conjunto de datos de entrenamiento y regímenes de entrenamiento supervisado frente a autosupervisado, los investigadores encontraron tres patrones notables: los modelos supervisados en conjuntos de datos a gran escala como ImageNet-21k tendían a arrastrar obstinadamente sus sesgos de preentrenamiento a cualquier nueva tarea para la que se ajustaran; el ajuste fino en un conjunto de datos objetivo más grande como OpenImages tenía más probabilidades de introducir nuevas asociaciones sesgadas que el ajuste fino en uno más pequeño como COCO; y los modelos autosupervisados, en particular MoCo, mostraron una menor retención de sesgos que sus contrapartes supervisadas, aunque esto no fue universal. Para cuantificar estas dinámicas, el equipo introdujo una métrica llamada Bias Transfer Score, basada en la correlación de rangos de Spearman, que mide cuánto cambian las asociaciones relacionadas con el sesgo de un modelo entre las etapas de preentrenamiento y ajuste fino. El trabajo es prácticamente significativo porque muchos desarrolladores adoptan modelos preentrenados como cajas negras sin visibilidad sobre qué sesgos sociales pueden estar importando silenciosamente a sus aplicaciones.

resumen

Presentamos un marco para medir cómo cambian los sesgos antes y después de ajustar finamente un modelo de reconocimiento visual a gran escala para una tarea posterior. Se sabe que los modelos de aprendizaje profundo entrenados con cantidades crecientes de datos codifican sesgos sociales. Muchos sistemas de visión por computador actuales dependen de modelos típicamente preentrenados en conjuntos de datos a gran escala. Si bien se han desarrollado técnicas de mitigación de sesgos para ajustar modelos a tareas posteriores, actualmente no está claro cuáles son los efectos de los sesgos ya codificados en un modelo preentrenado. Nuestro marco incorpora conjuntos de imágenes canónicas que representan conceptos individuales y pares de conceptos para resaltar los cambios en los sesgos de una variedad de modelos preentrenados disponibles, a través de distintos tamaños de modelo, tamaños de conjunto de datos y objetivos de entrenamiento. A través de nuestros análisis, encontramos que (1) los modelos supervisados entrenados en conjuntos de datos como ImageNet-21k tienen más probabilidades de retener sus sesgos de preentrenamiento independientemente del conjunto de datos objetivo, en comparación con los modelos autosupervisados. También encontramos que (2) los modelos ajustados finamente en conjuntos de datos a mayor escala tienen más probabilidades de introducir nuevas asociaciones sesgadas. Nuestros resultados también sugieren que (3) los sesgos pueden transferirse a los modelos ajustados finamente, y que el objetivo y el conjunto de datos de ajuste fino pueden afectar el alcance de los sesgos transferidos.

detalles

comentario: 10 pages, 3 Figures

cita

@inproceedings{ranjit2023variation,
  title = {Variation of Gender Biases in Visual Recognition Models Before and After Finetuning},
  author = {Ranjit, Jaspreet and Wang, Tianlu and Ray, Baishakhi and Ordonez, Vicente},
  year = {2023},
  booktitle = {Workshop on Algorithmic Fairness through the Lens of Time at NeuRIPS 2023},
  url = {https://arxiv.org/abs/2303.07615},
}