Variation of Gender Biases in Visual Recognition Models Before and After Finetuning
Tóm tắt thông cáo báo chí
Các nhà nghiên cứu từ USC, Columbia, Meta AI và Rice University đã phát triển một khung để theo dõi cách các thiên kiến giới tính được nhúng trong các mô hình thị giác máy tính tiền huấn luyện phổ biến hành xử ra sao khi những mô hình đó được tinh chỉnh cho các nhiệm vụ hạ nguồn cụ thể — một câu hỏi đã nhận được sự chú ý có hệ thống một cách đáng ngạc nhiên là ít ỏi, bất chấp việc các mô hình tiền huấn luyện này được tái sử dụng rộng rãi trong công nghiệp và học thuật. Nhóm đã xây dựng các tập ảnh tham chiếu được tuyển chọn lấy từ các bộ dữ liệu COCO và OpenImages, ghép cặp các đối tượng thường ngày như ván lướt sóng và xe hơi với ảnh của đàn ông và phụ nữ, và sau đó đo lường mức độ chặt chẽ mà các biểu diễn đặc trưng nội tại của một mô hình gom cụm những ảnh đối tượng đó với một giới tính so với giới tính kia, cả trước và sau khi tinh chỉnh. Khi kiểm tra sáu mô hình có sẵn — bao gồm các biến thể ResNet, CLIP, MoCo và SimCLR — qua các kiến trúc, các kích thước bộ dữ liệu huấn luyện, và các chế độ huấn luyện có giám sát so với Self-Supervised khác nhau, các nhà nghiên cứu nhận thấy ba mẫu hình đáng chú ý: các mô hình được giám sát trên các bộ dữ liệu quy mô lớn như ImageNet-21k có xu hướng mang theo các thiên kiến tiền huấn luyện của chúng một cách ngoan cố vào bất kỳ nhiệm vụ mới nào mà chúng được tinh chỉnh; việc tinh chỉnh trên một bộ dữ liệu đích lớn hơn như OpenImages có nhiều khả năng đưa vào các liên tưởng thiên kiến mới hơn so với việc tinh chỉnh trên một bộ nhỏ hơn như COCO; và các mô hình Self-Supervised, đặc biệt là MoCo, cho thấy ít giữ lại thiên kiến hơn so với các đối tác có giám sát của chúng, dù điều này không phổ quát. Để định lượng những động lực này, nhóm đã giới thiệu một độ đo gọi là Bias Transfer Score, dựa trên hệ số tương quan hạng Spearman, đo lường mức độ các liên tưởng liên quan đến thiên kiến của một mô hình dịch chuyển giữa các giai đoạn tiền huấn luyện và tinh chỉnh. Công trình có ý nghĩa thực tiễn vì nhiều nhà phát triển áp dụng các mô hình tiền huấn luyện như những hộp đen mà không có khả năng nhìn thấy những thiên kiến xã hội nào mà chúng có thể đang âm thầm nhập vào các ứng dụng của họ.
tóm tắt
Chúng tôi giới thiệu một khung để đo lường cách các thiên kiến (bias) thay đổi trước và sau khi tinh chỉnh một mô hình nhận diện thị giác quy mô lớn cho một nhiệm vụ hạ nguồn. Các mô hình Deep Learning được huấn luyện trên lượng dữ liệu ngày càng tăng được biết đến là mã hóa các thiên kiến xã hội. Nhiều hệ thống thị giác máy tính ngày nay dựa vào các mô hình thường được tiền huấn luyện trên các bộ dữ liệu quy mô lớn. Mặc dù các kỹ thuật giảm thiểu thiên kiến đã được phát triển để điều chỉnh các mô hình cho các nhiệm vụ hạ nguồn, hiện vẫn chưa rõ tác động của những thiên kiến đã được mã hóa sẵn trong một mô hình tiền huấn luyện là gì. Khung của chúng tôi kết hợp các tập ảnh chuẩn tắc đại diện cho từng khái niệm riêng lẻ và từng cặp khái niệm nhằm làm nổi bật những thay đổi về thiên kiến đối với một loạt các mô hình tiền huấn luyện có sẵn qua các kích thước mô hình, kích thước bộ dữ liệu và mục tiêu huấn luyện khác nhau. Thông qua các phân tích của chúng tôi, chúng tôi nhận thấy rằng (1) các mô hình có giám sát được huấn luyện trên các bộ dữ liệu như ImageNet-21k có nhiều khả năng giữ lại các thiên kiến tiền huấn luyện của chúng bất kể bộ dữ liệu đích là gì, so với các mô hình Self-Supervised. Chúng tôi cũng nhận thấy rằng (2) các mô hình được tinh chỉnh trên các bộ dữ liệu quy mô lớn hơn có nhiều khả năng đưa vào các liên tưởng thiên kiến mới. Các kết quả của chúng tôi cũng cho thấy rằng (3) các thiên kiến có thể chuyển giao sang các mô hình được tinh chỉnh và mục tiêu cùng bộ dữ liệu tinh chỉnh có thể tác động đến mức độ của các thiên kiến được chuyển giao.
chi tiết
trích dẫn
@inproceedings{ranjit2023variation,
title = {Variation of Gender Biases in Visual Recognition Models Before and After Finetuning},
author = {Ranjit, Jaspreet and Wang, Tianlu and Ray, Baishakhi and Ordonez, Vicente},
year = {2023},
booktitle = {Workshop on Algorithmic Fairness through the Lens of Time at NeuRIPS 2023},
url = {https://arxiv.org/abs/2303.07615},
}