Deep Feature Aggregation and Image Re-ranking with Heat Diffusion for Image Retrieval
Resumo do comunicado de imprensa
Pesquisadores da Xi'an Jiaotong University e da University of Virginia desenvolveram um novo sistema de busca de imagens que toma emprestado um conceito da física — a difusão de calor — para tornar os mecanismos de busca visual mais precisos e eficientes. O problema central que eles abordaram é que sistemas padrão de recuperação de imagens podem ser confundidos por padrões visuais repetitivos, como as fileiras de janelas idênticas na fachada de um edifício, que inundam o sistema com informações redundantes e dificultam identificar o que é realmente distintivo em uma imagem. Para resolver isso, a equipe tratou cada atributo local extraído de uma rede neural convolucional como uma fonte de calor e, em seguida, usou a matemática da difusão de calor para medir quão "bursty" (em rajada) ou repetitivo é esse atributo — atributos que espalham calor amplamente por uma rede de vizinhos semelhantes são sinalizados como redundantes, enquanto atributos isolados que geram pouca transferência de calor são tratados como mais distintivos. O sistema então atribui pesos aos atributos de acordo, antes de combiná-los em um único descritor de imagem compacto. O mesmo princípio de difusão de calor também foi aplicado no nível da imagem, em que uma imagem de consulta atua como fonte de calor e o calor que ela espalha para as imagens candidatas do banco de dados é usado para reordenar os resultados da busca. Em testes em benchmarks padrão, incluindo os conjuntos de dados Oxford Buildings e Paris, a abordagem superou métodos concorrentes, em alguns casos melhorando a precisão da recuperação em mais de cinco pontos percentuais em conjuntos de dados de larga escala, mantendo-se rápida o suficiente para uso prático — tudo isso sem exigir nenhum dado de treinamento rotulado adicional.
resumo
A recuperação de imagens baseada em atributos convolucionais profundos demonstrou desempenho de ponta em benchmarks populares. Neste artigo, apresentamos uma solução unificada para abordar a agregação de atributos convolucionais profundos e o reordenamento de imagens simulando a dinâmica da difusão de calor. Um problema distintivo na recuperação de imagens é que atributos repetitivos ou \emph{bursty} (em rajada) tendem a dominar as representações finais das imagens, resultando em representações menos distinguíveis. Mostramos que, ao considerar cada atributo profundo como uma fonte de calor, nosso método de agregação não supervisionado é capaz de evitar a sobre-representação de atributos \emph{bursty}. Além disso, fornecemos uma solução prática para o método de agregação proposto e demonstramos a eficiência do nosso método na avaliação experimental. Inspirados pelo método de agregação de atributos profundos mencionado, propomos também um método para reordenar um conjunto de imagens mais bem classificadas para uma determinada imagem de consulta, considerando a consulta como a fonte de calor. Por fim, avaliamos extensivamente a abordagem proposta com redes profundas pré-treinadas e ajustadas em benchmarks públicos comuns e mostramos desempenho superior em comparação com trabalhos anteriores.
detalhes
citação
@article{pang2019deep,
title = {Deep Feature Aggregation and Image Re-ranking with Heat Diffusion for Image Retrieval},
author = {Pang, Shanmin and Ma, Jin and Xue, Jianru and Zhu, Jihua and Ordonez, Vicente},
year = {2019},
journal = {IEEE Transactions on Multimedia 2019 (Journal).},
url = {https://arxiv.org/abs/1805.08587},
}