Feedback-prop: Convolutional Neural Network Inference under Partial Evidence
publication

Feedback-prop: Convolutional Neural Network Inference under Partial Evidence

Tianlu Wang, Kota Yamaguchi, Vicente Ordonez.
Conference on Computer Vision and Pattern Recognition. CVPR 2018. Salt Lake City, Utah. June 2018.
Mesa de notícias do laboratório

Resumo do comunicado de imprensa

Esta seção foi escrita intencionalmente em tom de comunicado de imprensa, em estilo jornalístico, para o público geral.

Pesquisadores da University of Virginia e da CyberAgent desenvolveram uma técnica que permite que redes neurais existentes de reconhecimento de imagens façam melhores previsões quando algumas informações sobre uma foto já são conhecidas antecipadamente. O método, chamado feedback-prop, aborda uma lacuna entre a forma como sistemas de visão computacional são tipicamente testados — usando apenas entrada visual — e a forma como costumam ser usados na prática, em que texto adjacente, dados de GPS, tags de usuário ou outras pistas contextuais frequentemente estão disponíveis. Em vez de retreinar uma rede para incorporar essa informação extra, os pesquisadores descobriram que poderiam, em vez disso, realimentar rótulos conhecidos através de uma rede treinada durante a própria etapa de inferência, ajustando as ativações internas da rede até que as previsões para os rótulos desconhecidos restantes melhorassem. Eles testaram duas variantes da abordagem — uma que atualiza camadas sequencialmente e outra que injeta pequenas variáveis corretivas em múltiplas camadas simultaneamente — em diversas tarefas, incluindo identificar objetos em imagens quando alguns rótulos já são conhecidos, prever categorias de cena de granularidade fina quando categorias gerais são fornecidas e gerar legendas de imagens quando anotações de objetos estão disponíveis. Em todas as tarefas e em múltiplas arquiteturas de rede padrão, incluindo VGG-16 e ResNet, adicionar evidência parcial melhorou consistentemente a precisão, com ganhos relativos variando de aproximadamente 10 a 13 por cento, dependendo da tarefa. Notavelmente, a técnica não requer alterações no treinamento do modelo original e funciona com uma combinação arbitrária de rótulos conhecidos e desconhecidos, tornando-a amplamente prática para cenários de implantação no mundo real, em que imagens raramente chegam sem qualquer contexto acompanhante.

resumo

Propomos um procedimento de inferência para redes neurais convolucionais profundas (CNNs) quando há evidência parcial disponível. Nosso método consiste em uma abordagem geral de propagação baseada em feedback (feedback-prop) que aumenta a precisão da previsão para um conjunto arbitrário de rótulos-alvo desconhecidos quando os valores de um conjunto arbitrário e não sobreposto de rótulos-alvo são conhecidos. Mostramos que modelos existentes treinados em um cenário multirrótulo ou multitarefa podem prontamente aproveitar o feedback-prop sem nenhum retreinamento ou ajuste fino. Nosso procedimento de inferência feedback-prop é geral, simples, confiável e funciona em diferentes tarefas desafiadoras de reconhecimento visual. Apresentamos duas variantes do feedback-prop baseadas em atualizações iterativas camada a camada e residuais. Experimentamos usando vários modelos multitarefa e mostramos que o feedback-prop é eficaz em todos eles. Nossos resultados revelam uma propriedade dinâmica interessante e até então não relatada das CNNs profundas. Também apresentamos uma abordagem técnica associada que aproveita essa propriedade para inferência sob evidência parcial em tarefas gerais de reconhecimento visual.

detalhes

comentário
Accepted to CVPR 2018

citação

@inproceedings{wang2018feedback,
  title = {Feedback-prop: Convolutional Neural Network Inference under Partial Evidence},
  author = {Wang, Tianlu and Yamaguchi, Kota and Ordonez, Vicente},
  year = {2018},
  booktitle = {Conference on Computer Vision and Pattern Recognition. CVPR 2018},
  url = {https://arxiv.org/abs/1710.08049},
}