MEDIRL: Predicting the Visual Attention of Drivers via Maximum Entropy Deep Inverse Reinforcement Learning.
résumé
Inspirés par l'attention visuelle humaine, nous proposons une nouvelle formulation d'apprentissage par renforcement inverse utilisant l'Apprentissage par Renforcement Inverse Profond à Entropie Maximale (MEDIRL) pour prédire l'attention visuelle des conducteurs dans des situations à risque d'accident. MEDIRL prédit les emplacements de fixation conduisant à des récompenses maximales en apprenant une fonction de récompense sensible à la tâche à partir des schémas de fixation oculaire enregistrés chez des conducteurs attentifs. De plus, nous introduisons EyeCar, un nouveau jeu de données sur l'attention des conducteurs dans des situations à risque d'accident. Nous menons des expériences approfondies pour évaluer notre modèle proposé sur trois benchmarks courants : (DR(eye)VE, BDD-A, DADA-2000) ainsi que notre jeu de données EyeCar. Les résultats indiquent que MEDIRL surpasse les modèles existants pour la prédiction de l'attention et atteint des performances de pointe. Nous présentons des études d'ablation approfondies afin de mieux éclairer les différentes caractéristiques de notre modèle proposé.
détails
citation
@inproceedings{baee2021medirl,
title = {MEDIRL: Predicting the Visual Attention of Drivers via Maximum Entropy Deep Inverse Reinforcement Learning.},
author = {Baee, Sonia and Pakdamanian, Erfan and Kim, Inki and Feng, Lu and Ordonez, Vicente and Barnes, Laura},
year = {2021},
booktitle = {International Conference on Computer Vision. ICCV 2021},
url = {https://arxiv.org/abs/1912.07773},
}