Fairness and Bias Mitigation in Computer Vision: A Survey
Tóm tắt thông cáo báo chí
Một nhóm các nhà nghiên cứu từ Michigan State University, Rice University, và UC San Diego đã công bố một khảo sát toàn diện xem xét cách thiên kiến và sự bất công xuất hiện trong các hệ thống thị giác máy tính và lĩnh vực này đã làm gì về điều đó. Vấn đề cốt lõi rất rõ ràng: khi các mô hình AI được huấn luyện trên dữ liệu ảnh thực tế học cách nhận diện khuôn mặt, mô tả cảnh, hay phát hiện đối tượng, chúng có thể hoạt động kém hơn rõ rệt đối với một số nhóm nhân khẩu học nhất định — chẳng hạn, một hệ thống nhận diện khuôn mặt mà các tác giả trích dẫn có tỉ lệ lỗi 0.7% trên các khuôn mặt da sáng nhưng tỉ lệ lỗi 12.9% trên các khuôn mặt da sẫm hơn. Các nhà nghiên cứu đã lập danh mục nguồn gốc của những chênh lệch này, truy ra chúng từ cả các tập dữ liệu được dùng để huấn luyện, vốn thường phản ánh các thiên kiến xã hội hiện có hoặc được thu thập chủ yếu ở một số khu vực địa lý nhất định, và từ các lựa chọn thiết kế trong chính các mô hình, vốn có thể khuếch đại những thiên kiến đó vượt quá mức đã có trong dữ liệu. Khảo sát phác họa các cách tiếp cận kỹ thuật chính mà các nhà nghiên cứu đã phát triển để chống lại, bao gồm các phương pháp huấn luyện đối kháng cố gắng loại bỏ các thuộc tính nhạy cảm như giới tính hay chủng tộc ra khỏi các biểu diễn được học, các kỹ thuật cân bằng lại dữ liệu sinh ra hoặc gán lại trọng số cho các ví dụ nhằm san bằng sân chơi, và các khung toán học đặc tả sự đánh đổi cơ bản giữa độ chính xác của một mô hình và tính công bằng của nó. Các tác giả cũng cảnh báo rằng các mô hình nền tảng sinh tạo và đa phương thức mới hơn như CLIP và các hệ thống text-to-image mang theo chính những vấn đề này trong khi giới thiệu những vấn đề mới, và rằng chưa tồn tại một định nghĩa toán học chặt chẽ nào về tính công bằng cho các mô hình sinh tạo — chỉ ra một khoảng trống đáng kể mà lĩnh vực này vẫn cần phải khép lại.
tóm tắt
Các hệ thống thị giác máy tính đã chứng kiến tiến bộ nhanh chóng trong hai thập kỷ qua nhờ nhiều bước tiến trong lĩnh vực này. Khi các hệ thống này ngày càng được triển khai trong các ứng dụng thực tế có rủi ro cao, có một nhu cầu cấp thiết phải đảm bảo rằng chúng không lan truyền hay khuếch đại bất kỳ xu hướng phân biệt đối xử nào trong dữ liệu lịch sử hay dữ liệu do con người tuyển chọn, hoặc vô tình học các thiên kiến từ các tương quan giả. Bài báo này trình bày một khảo sát toàn diện về tính công bằng nhằm tóm tắt và làm sáng tỏ các xu hướng và thành công đang diễn ra trong bối cảnh thị giác máy tính. Các chủ đề chúng tôi thảo luận bao gồm 1) Nguồn gốc và các định nghĩa kỹ thuật về tính công bằng được rút ra từ tài liệu rộng hơn về học máy công bằng và các ngành liền kề. 2) Các công trình tìm cách khám phá và phân tích các thiên kiến trong các hệ thống thị giác máy tính. 3) Một bản tóm tắt các phương pháp được đề xuất để giảm thiểu thiên kiến trong các hệ thống thị giác máy tính trong những năm gần đây. 4) Một bản tóm tắt toàn diện về các tài nguyên và tập dữ liệu do các nhà nghiên cứu tạo ra để đo lường, phân tích, và giảm thiểu thiên kiến cũng như nâng cao tính công bằng. 5) Thảo luận về thành công của lĩnh vực, các xu hướng đang tiếp diễn trong bối cảnh các mô hình nền tảng đa phương thức và sinh tạo, và những khoảng trống vẫn cần được giải quyết. Sự đặc tả được trình bày sẽ giúp các nhà nghiên cứu hiểu tầm quan trọng của việc xác định và giảm thiểu thiên kiến trong thị giác máy tính cũng như hiện trạng của lĩnh vực và xác định các hướng tiềm năng cho nghiên cứu tương lai.
chi tiết
trích dẫn
@article{dehdashtian2024fairness,
title = {Fairness and Bias Mitigation in Computer Vision: A Survey},
author = {Dehdashtian, Sepehr and He, Ruozhen and Li, Yi and Balakrishnan, Guha and Vasconcelos, Nuno and Ordonez, Vicente and Boddeti, Vishnu Naresh},
year = {2024},
journal = {arXiv preprint arXiv:2408.02464},
url = {https://arxiv.org/abs/2408.02464},
}