Variation of Gender Biases in Visual Recognition Models Before and After Finetuning
publication

Variation of Gender Biases in Visual Recognition Models Before and After Finetuning

Jaspreet Ranjit, Tianlu Wang, Baishakhi Ray, Vicente Ordonez.
Workshop on Algorithmic Fairness through the Lens of Time at NeuRIPS 2023. New Orleans, LA.
연구실 뉴스 데스크

보도 자료 요약

이 섹션은 일반 독자를 위해 의도적으로 기자 보도 자료 형식으로 작성되었습니다.

USC, 컬럼비아 대학교, Meta AI, 라이스 대학교의 연구자들은 인기 있는 사전학습 컴퓨터 비전 모델에 내재된 성별 편향이 특정 다운스트림 작업을 위해 미세조정될 때 어떻게 거동하는지를 추적하는 프레임워크를 개발했는데, 이는 이러한 사전학습 모델이 산업과 학계에서 얼마나 널리 재사용되는지에 비해 놀라울 만큼 체계적인 관심을 거의 받지 못한 문제이다. 연구팀은 COCO와 OpenImages 데이터셋에서 가져온 정제된 참조 이미지 집합을 구축하여 서핑보드와 자동차 같은 일상 객체를 남성 및 여성의 이미지와 짝지은 다음, 모델의 내부 특징 표현이 그러한 객체 이미지를 한 성별과 다른 성별 중 어느 쪽으로 군집화하는지를 미세조정 전과 후 모두에서 측정했다. ResNet 변형, CLIP, MoCo, SimCLR을 포함한 여섯 개의 기성 모델을 서로 다른 아키텍처, 학습 데이터셋 크기, 그리고 지도학습 대 자기지도 학습 방식에 걸쳐 시험한 결과, 연구자들은 세 가지 주목할 만한 패턴을 발견했다. ImageNet-21k 같은 대규모 데이터셋으로 지도학습된 모델은 어떤 새로운 작업으로 미세조정되든 사전학습 편향을 끈질기게 가져가는 경향이 있었다. OpenImages 같은 더 큰 목표 데이터셋으로의 미세조정은 COCO 같은 더 작은 데이터셋으로의 미세조정보다 새로운 편향된 연관을 도입할 가능성이 더 높았다. 그리고 자기지도 모델, 특히 MoCo는 보편적이지는 않았지만 지도학습 대응 모델보다 편향 유지가 덜한 모습을 보였다. 이러한 역학을 정량화하기 위해 연구팀은 Spearman 순위 상관에 기반한 Bias Transfer Score라는 지표를 도입했는데, 이는 모델의 편향 관련 연관이 사전학습 단계와 미세조정 단계 사이에서 얼마나 변화하는지를 측정한다. 이 연구는 많은 개발자가 어떤 사회적 편향을 자신의 애플리케이션에 조용히 들여오고 있는지에 대한 가시성 없이 사전학습 모델을 블랙박스로 채택한다는 점에서 실용적으로 의미가 있다.

초록

우리는 다운스트림 작업을 위해 대규모 시각 인식 모델을 미세조정하기 전과 후에 편향이 어떻게 변화하는지를 측정하는 프레임워크를 도입한다. 점점 더 많은 양의 데이터로 학습된 딥러닝 모델은 사회적 편향을 부호화하는 것으로 알려져 있다. 오늘날 많은 컴퓨터 비전 시스템은 일반적으로 대규모 데이터셋으로 사전학습된 모델에 의존한다. 다운스트림 작업을 위해 모델을 조정하기 위한 편향 완화 기법이 개발되어 왔지만, 사전학습된 모델에 이미 부호화된 편향이 어떤 영향을 미치는지는 현재 불분명하다. 우리의 프레임워크는 개별 개념과 개념 쌍을 나타내는 정준(canonical) 이미지 집합을 통합하여, 모델 크기, 데이터셋 크기, 학습 목적함수에 걸친 다양한 기성(off-the-shelf) 사전학습 모델의 편향 변화를 부각한다. 우리의 분석을 통해 우리는 (1) ImageNet-21k와 같은 데이터셋으로 학습된 지도학습 모델이 자기지도(self-supervised) 모델에 비해 목표 데이터셋과 무관하게 사전학습 편향을 유지할 가능성이 더 높다는 것을 발견한다. 또한 우리는 (2) 더 큰 규모의 데이터셋으로 미세조정된 모델이 새로운 편향된 연관을 도입할 가능성이 더 높다는 것을 발견한다. 우리의 결과는 또한 (3) 편향이 미세조정된 모델로 이전될 수 있으며 미세조정 목적함수와 데이터셋이 이전된 편향의 정도에 영향을 줄 수 있음을 시사한다.

세부 정보

비고
10 pages, 3 Figures

인용

@inproceedings{ranjit2023variation,
  title = {Variation of Gender Biases in Visual Recognition Models Before and After Finetuning},
  author = {Ranjit, Jaspreet and Wang, Tianlu and Ray, Baishakhi and Ordonez, Vicente},
  year = {2023},
  booktitle = {Workshop on Algorithmic Fairness through the Lens of Time at NeuRIPS 2023},
  url = {https://arxiv.org/abs/2303.07615},
}