プレスリリース要約
南カリフォルニア大学(USC)、コロンビア大学、Meta AI、ライス大学の研究者らは、人気の事前学習済みコンピュータビジョンモデルに埋め込まれたジェンダーバイアスが、それらのモデルが特定の下流タスク向けにファインチューニングされたときにどのように振る舞うかを追跡するフレームワークを開発しました。これは、こうした事前学習済みモデルが産業界と学術界でいかに広く再利用されているかにもかかわらず、驚くほど体系的な注目を受けてこなかった問題です。研究チームは、COCOおよびOpenImagesデータセットから抜き出した参照画像の厳選された集合を構築し、サーフボードや車のような日常的な物体を男性と女性の画像とペアにしました。そして、ファインチューニングの前後の両方で、モデルの内部特徴表現がそれらの物体画像を一方のジェンダーともう一方のジェンダーのどちらにどれだけ近くクラスタリングするかを測定しました。ResNetの各種、CLIP、MoCo、SimCLRを含む6つの既製モデルを、異なるアーキテクチャ、訓練データセットサイズ、教師あり対自己教師ありの訓練体制にわたってテストした結果、研究者らは3つの注目すべきパターンを発見しました。ImageNet-21kのような大規模データセットで教師ありに訓練されたモデルは、ファインチューニングされたどんな新しいタスクにも事前学習時のバイアスを頑固に持ち込む傾向がありました。OpenImagesのようなより大きな対象データセットでのファインチューニングは、COCOのようなより小さなものでのファインチューニングよりも、新たなバイアスのある関連付けを導入しやすいものでした。そして、自己教師ありモデル、特にMoCoは、教師ありの対応物よりもバイアスの保持が少ないことを示しましたが、これは普遍的ではありませんでした。これらの動態を定量化するため、研究チームはSpearmanの順位相関に基づくBias Transfer Score(バイアス転移スコア)と呼ばれる指標を導入しました。これは、モデルのバイアス関連の関連付けが事前学習段階とファインチューニング段階の間でどれだけシフトするかを測定するものです。この研究が実用上重要なのは、多くの開発者が、自らのアプリケーションにどのような社会的バイアスを密かに取り込んでいるかを把握できないまま、事前学習済みモデルをブラックボックスとして採用しているからです。
要旨
私たちは、大規模な視覚認識モデルを下流タスク向けにファインチューニングする前後で、バイアスがどのように変化するかを測定するフレームワークを導入します。増え続ける量のデータで訓練された深層学習モデルは、社会的バイアスを符号化することが知られています。今日の多くのコンピュータビジョンシステムは、通常、大規模データセットで事前学習されたモデルに依存しています。下流タスク向けにモデルを調整するためのバイアス緩和技術は開発されてきましたが、事前学習済みモデルにすでに符号化されているバイアスがどのような影響を及ぼすかは、現時点では明らかではありません。私たちのフレームワークは、個々の概念および概念のペアを表す正準的な画像の集合を組み込み、モデルサイズ、データセットサイズ、訓練目的にわたるさまざまな既製の事前学習済みモデルについてバイアスの変化を浮き彫りにします。私たちの分析を通じて、私たちは次のことを発見しました。(1)ImageNet-21kのようなデータセットで訓練された教師ありモデルは、自己教師ありモデルと比較して、対象データセットに関わらず事前学習時のバイアスを保持しやすい。また、(2)より大規模なデータセットでファインチューニングされたモデルは、新たなバイアスのある関連付けを導入しやすいことも分かりました。私たちの結果はさらに、(3)バイアスがファインチューニングされたモデルに転移しうること、そしてファインチューニングの目的とデータセットが転移するバイアスの程度に影響しうることを示唆しています。
詳細
引用
@inproceedings{ranjit2023variation,
title = {Variation of Gender Biases in Visual Recognition Models Before and After Finetuning},
author = {Ranjit, Jaspreet and Wang, Tianlu and Ray, Baishakhi and Ordonez, Vicente},
year = {2023},
booktitle = {Workshop on Algorithmic Fairness through the Lens of Time at NeuRIPS 2023},
url = {https://arxiv.org/abs/2303.07615},
}