Fairness and Bias Mitigation in Computer Vision: A Survey
Resumo do comunicado de imprensa
Uma equipe de pesquisadores da Michigan State University, da Rice University e da UC San Diego publicou uma revisão abrangente examinando como o viés e a falta de equidade se manifestam em sistemas de visão computacional e o que a área tem feito a respeito. O problema central é direto: quando modelos de IA treinados em dados de imagens do mundo real aprendem a reconhecer rostos, descrever cenas ou detectar objetos, eles podem ter um desempenho notavelmente pior para certos grupos demográficos — por exemplo, um sistema de reconhecimento facial citado pelos autores tinha uma taxa de erro de 0,7% em rostos de pele mais clara, mas uma taxa de erro de 12,9% em rostos de pele mais escura. Os pesquisadores catalogaram as origens dessas disparidades, atribuindo-as tanto aos conjuntos de dados usados para treinamento, que frequentemente refletem vieses sociais existentes ou foram coletados principalmente em certas regiões geográficas, quanto às escolhas de projeto dos próprios modelos, que podem amplificar esses vieses para além do que já estava nos dados. A revisão mapeia as principais abordagens técnicas que os pesquisadores desenvolveram para combater isso, incluindo métodos de treinamento adversarial que tentam remover atributos sensíveis, como gênero ou raça, das representações aprendidas, técnicas de reequilíbrio de dados que geram ou reponderam exemplos para nivelar o campo de jogo, e arcabouços matemáticos que caracterizam a compensação fundamental entre a acurácia de um modelo e sua equidade. Os autores também alertam que modelos de fundação generativos e multimodais mais novos, como o CLIP e os sistemas de texto para imagem, carregam esses mesmos problemas adiante ao mesmo tempo em que introduzem outros novos, e que ainda não existe uma definição matemática rigorosa de equidade para modelos generativos — apontando para uma lacuna significativa que a área ainda precisa fechar.
resumo
Os sistemas de visão computacional testemunharam um rápido progresso ao longo das duas últimas décadas devido a múltiplos avanços na área. À medida que esses sistemas são cada vez mais implantados em aplicações do mundo real de alto risco, há uma necessidade urgente de garantir que eles não propaguem ou amplifiquem quaisquer tendências discriminatórias presentes em dados históricos ou curados por humanos, nem aprendam inadvertidamente vieses a partir de correlações espúrias. Este artigo apresenta uma revisão abrangente sobre equidade que resume e esclarece as tendências e os sucessos em andamento no contexto da visão computacional. Os tópicos que discutimos incluem 1) A origem e as definições técnicas de equidade extraídas da literatura mais ampla de aprendizado de máquina justo e de disciplinas adjacentes. 2) Trabalhos que buscaram descobrir e analisar vieses em sistemas de visão computacional. 3) Um resumo dos métodos propostos para mitigar vieses em sistemas de visão computacional nos últimos anos. 4) Um resumo abrangente dos recursos e conjuntos de dados produzidos por pesquisadores para medir, analisar e mitigar vieses e aprimorar a equidade. 5) Discussão sobre os sucessos da área, tendências contínuas no contexto de modelos de fundação multimodais e generativos, e lacunas que ainda precisam ser abordadas. A caracterização apresentada deve ajudar os pesquisadores a compreender a importância de identificar e mitigar vieses na visão computacional e o estado da área, além de identificar possíveis direções para pesquisas futuras.
detalhes
citação
@article{dehdashtian2024fairness,
title = {Fairness and Bias Mitigation in Computer Vision: A Survey},
author = {Dehdashtian, Sepehr and He, Ruozhen and Li, Yi and Balakrishnan, Guha and Vasconcelos, Nuno and Ordonez, Vicente and Boddeti, Vishnu Naresh},
year = {2024},
journal = {arXiv preprint arXiv:2408.02464},
url = {https://arxiv.org/abs/2408.02464},
}