Skip to main content
language
  • English
  • Español
  • 中文
  • 한국어
  • Português
  • Français
  • 日本語
  • Deutsch
  • Italiano
Vision, Language and Learning Lab
|
Rice University
Vision, Language and Learning Lab
|
Rice University
home membri demo pubblicazioni

demo

Abbinatore generale immagine-testo

Questa demo cerca di evidenziare aree di un'immagine condizionate da un testo di input arbitrario.

Genderless

Questa demo cerca di rendere difficile per un modello prevedere il genere a partire da un'immagine, modificandola in modo che questo compito diventi più arduo pur conservando gran parte delle informazioni dell'immagine.

Text2Scene

Questa demo trasforma descrizioni testuali in una scena generata automaticamente, assemblando gli oggetti in sequenza su uno sfondo semplice, passo dopo passo, utilizzando reti neurali di generazione di sequenze.

Traduttore visivo

Questa demo cerca di tradurre una frase in inglese in uno spazio di caratteristiche visive e in una frase sia in tedesco (Deutsch) sia in giapponese (日本語).

Esploratore SBU Captions

Cerca immagini tramite testo nel dataset SBU Captions, che contiene 1 milione di immagini con didascalie provenienti da Flickr ed è stato utilizzato in numerosi progetti.

Esploratore COCO Captions

Cerca immagini tramite testo nel celebre dataset Common Objects in Context (COCO), gestito dalla Common Visual Data Foundation.

Dipartimento di Informatica @ Rice University ‒ 6100 Main St, Duncan Hall, Houston, TX 77005-1827