Skip to main content
language
  • English
  • Español
  • 中文
  • 한국어
  • Português
  • Français
  • 日本語
Vision, Language and Learning Lab
|
Rice University
Vision, Language and Learning Lab
|
Rice University
accueil équipe démos publications

démos

Apparieur général image-texte

Cette démo tente de mettre en évidence des zones d'une image en fonction d'un texte d'entrée arbitraire.

Genderless

Cette démo tente de rendre difficile la prédiction du genre à partir d'une image par un modèle, en la modifiant de sorte que cette tâche devienne plus ardue tout en conservant l'essentiel de l'information de l'image.

Text2Scene

Cette démo transforme des descriptions textuelles en une scène générée automatiquement, en assemblant des objets de manière séquentielle sur un fond uni, étape par étape, à l'aide de réseaux de neurones de génération de séquences.

Traducteur visuel

Cette démo tente de traduire une phrase en anglais dans un espace de caractéristiques visuelles ainsi qu'en une phrase à la fois en allemand (Deutsch) et en japonais (日本語).

Explorateur SBU Captions

Recherchez des images par texte dans le jeu de données SBU Captions, qui contient 1 million d'images avec des légendes issues de Flickr et a été utilisé dans de nombreux projets.

Explorateur COCO Captions

Recherchez des images par texte dans le célèbre jeu de données Common Objects in Context (COCO), maintenu par la Common Visual Data Foundation.

Département d'informatique @ Rice University ‒ 6100 Main St, Duncan Hall, Houston, TX 77005-1827