보도 자료 요약
Michigan State University, 라이스 대학교, UC San Diego의 연구진은 컴퓨터 비전 시스템에서 편향과 불공정이 어떻게 나타나며 이 분야가 그에 대해 무엇을 해 왔는지를 검토하는 포괄적인 서베이를 발표하였다. 핵심 문제는 단순하다. 실세계 이미지 데이터로 학습한 AI 모델이 얼굴을 인식하거나, 장면을 묘사하거나, 객체를 탐지하는 법을 배울 때, 특정 인구 집단에 대해 눈에 띄게 더 나쁜 성능을 보일 수 있다는 것이다. 예를 들어 저자들이 인용한 한 얼굴 인식 시스템은 밝은 피부의 얼굴에서는 0.7%의 오류율을 보였으나 어두운 피부의 얼굴에서는 12.9%의 오류율을 보였다. 연구진은 이러한 격차의 기원을 정리하면서, 그 원인을 기존의 사회적 편향을 반영하거나 주로 특정 지리적 지역에서 수집된 학습용 데이터셋과, 그러한 편향을 데이터에 이미 존재하던 수준 이상으로 증폭할 수 있는 모델 자체의 설계 선택 양쪽으로 추적하였다. 이 서베이는 연구자들이 이에 맞서기 위해 개발한 주요 기술적 접근을 정리하는데, 여기에는 성별이나 인종 같은 민감한 속성을 학습된 표현에서 제거하려는 적대적 학습 방법, 공정한 경쟁의 장을 만들기 위해 예시를 생성하거나 재가중하는 데이터 재균형 기법, 그리고 모델의 정확도와 공정성 사이의 근본적인 절충을 특성화하는 수학적 프레임워크가 포함된다. 저자들은 또한 CLIP이나 텍스트-이미지 시스템 같은 최신 생성 및 멀티모달 파운데이션 모델이 이러한 동일한 문제를 그대로 이어가면서 새로운 문제를 도입하고 있으며, 생성 모델에 대한 엄밀한 수학적 공정성 정의가 아직 존재하지 않는다는 점을 지적하면서, 이 분야가 여전히 메워야 할 중대한 공백을 가리킨다.
초록
컴퓨터 비전 시스템은 이 분야의 여러 발전 덕분에 지난 20년에 걸쳐 빠른 진보를 목격해 왔다. 이러한 시스템이 고위험의 실세계 응용에 점점 더 많이 배치됨에 따라, 시스템이 역사적 데이터나 사람이 선별한 데이터에 담긴 차별적 경향을 전파하거나 증폭하지 않도록, 또는 허위 상관관계로부터 의도치 않게 편향을 학습하지 않도록 보장해야 할 절실한 필요가 있다. 본 논문은 컴퓨터 비전의 맥락에서 진행 중인 동향과 성과를 요약하고 조명하는 공정성에 관한 포괄적인 서베이를 제시한다. 우리가 논의하는 주제는 다음과 같다. 1) 더 넓은 공정 머신러닝 문헌과 인접 분야로부터 도출한 공정성의 기원과 기술적 정의. 2) 컴퓨터 비전 시스템의 편향을 발견하고 분석하려는 연구. 3) 최근 수년간 컴퓨터 비전 시스템의 편향을 완화하기 위해 제안된 방법들의 요약. 4) 편향을 측정, 분석, 완화하고 공정성을 향상하기 위해 연구자들이 만든 자원과 데이터셋에 대한 포괄적인 요약. 5) 이 분야의 성과, 멀티모달 파운데이션 및 생성 모델의 맥락에서 지속되는 동향, 그리고 여전히 다루어야 할 공백에 대한 논의. 제시된 정리는 연구자들이 컴퓨터 비전에서 편향을 식별하고 완화하는 것의 중요성과 이 분야의 현황을 이해하고, 향후 연구를 위한 잠재적 방향을 파악하는 데 도움이 될 것이다.
세부 정보
인용
@article{dehdashtian2024fairness,
title = {Fairness and Bias Mitigation in Computer Vision: A Survey},
author = {Dehdashtian, Sepehr and He, Ruozhen and Li, Yi and Balakrishnan, Guha and Vasconcelos, Nuno and Ordonez, Vicente and Boddeti, Vishnu Naresh},
year = {2024},
journal = {arXiv preprint arXiv:2408.02464},
url = {https://arxiv.org/abs/2408.02464},
}