Fairness and Bias Mitigation in Computer Vision: A Survey
Zusammenfassung der Pressemitteilung
Ein Team von Forschenden der Michigan State University, der Rice University und der UC San Diego hat eine umfassende Übersicht veröffentlicht, die untersucht, wie sich Verzerrungen und Ungerechtigkeit in Computer-Vision-Systemen zeigen und was das Gebiet dagegen unternommen hat. Das Kernproblem ist eindeutig: Wenn KI-Modelle, die auf realen Bilddaten trainiert wurden, lernen, Gesichter zu erkennen, Szenen zu beschreiben oder Objekte zu detektieren, können sie für bestimmte demografische Gruppen merklich schlechter abschneiden – beispielsweise hatte ein von den Autoren zitiertes Gesichtserkennungssystem eine Fehlerrate von 0,7 % bei helleren Gesichtern, aber eine Fehlerrate von 12,9 % bei dunkleren. Die Forschenden katalogisierten die Ursprünge dieser Unterschiede und führten sie sowohl auf die für das Training verwendeten Datensätze zurück, die oft bestehende gesellschaftliche Verzerrungen widerspiegeln oder primär in bestimmten geografischen Regionen erhoben wurden, als auch auf die Designentscheidungen in den Modellen selbst, die diese Verzerrungen über das hinaus verstärken können, was bereits in den Daten enthalten war. Die Übersicht skizziert die wichtigsten technischen Ansätze, die Forschende zur Gegenwehr entwickelt haben, darunter adversarielle Trainingsmethoden, die versuchen, sensible Attribute wie Geschlecht oder Ethnie aus erlernten Repräsentationen zu entfernen, Techniken zum Datenausgleich, die Beispiele erzeugen oder neu gewichten, um gleiche Ausgangsbedingungen zu schaffen, sowie mathematische Rahmenwerke, die den grundlegenden Zielkonflikt zwischen der Genauigkeit eines Modells und seiner Fairness charakterisieren. Die Autoren weisen außerdem darauf hin, dass neuere generative und multimodale Foundation-Modelle wie CLIP und Text-zu-Bild-Systeme dieselben Probleme weitertragen und zugleich neue einführen und dass noch keine rigorose mathematische Definition von Fairness für generative Modelle existiert – worin sie auf eine bedeutende Lücke hinweisen, die das Gebiet noch schließen muss.
Zusammenfassung
Computer-Vision-Systeme haben in den letzten zwei Jahrzehnten dank zahlreicher Fortschritte auf dem Gebiet einen raschen Fortschritt erlebt. Da diese Systeme zunehmend in folgenreichen realen Anwendungen eingesetzt werden, besteht ein dringender Bedarf sicherzustellen, dass sie keine diskriminierenden Tendenzen in historischen oder von Menschen kuratierten Daten weitertragen oder verstärken oder unbeabsichtigt Verzerrungen aus Scheinkorrelationen erlernen. Diese Arbeit präsentiert eine umfassende Übersicht über Fairness, die laufende Trends und Erfolge im Kontext der Computer Vision zusammenfasst und beleuchtet. Zu den von uns behandelten Themen gehören 1) der Ursprung und die technischen Definitionen von Fairness, die aus der breiteren Literatur zum fairen maschinellen Lernen und angrenzenden Disziplinen stammen; 2) Arbeiten, die darauf abzielten, Verzerrungen in Computer-Vision-Systemen zu entdecken und zu analysieren; 3) eine Zusammenfassung der in den letzten Jahren vorgeschlagenen Methoden zur Minderung von Verzerrungen in Computer-Vision-Systemen; 4) eine umfassende Zusammenfassung der von Forschenden erstellten Ressourcen und Datensätze zur Messung, Analyse und Minderung von Verzerrungen sowie zur Verbesserung der Fairness; 5) eine Diskussion über die Erfolge des Gebiets, fortlaufende Trends im Kontext multimodaler Foundation- und generativer Modelle sowie Lücken, die noch geschlossen werden müssen. Die vorgestellte Charakterisierung soll Forschenden helfen, die Bedeutung der Identifizierung und Minderung von Verzerrungen in der Computer Vision sowie den Stand des Gebiets zu verstehen und potenzielle Richtungen für künftige Forschung zu identifizieren.
Details
Zitation
@article{dehdashtian2024fairness,
title = {Fairness and Bias Mitigation in Computer Vision: A Survey},
author = {Dehdashtian, Sepehr and He, Ruozhen and Li, Yi and Balakrishnan, Guha and Vasconcelos, Nuno and Ordonez, Vicente and Boddeti, Vishnu Naresh},
year = {2024},
journal = {arXiv preprint arXiv:2408.02464},
url = {https://arxiv.org/abs/2408.02464},
}