The Amazon Nova Family of Models: Technical Report and Model Card

Amazon AGI; and 680 additional authors

← retour aux publications

preprint

The Amazon Nova Family of Models: Technical Report and Model Card

Amazon AGI, and 680 additional authors.

arXiv:2506.12103 March 2025.

article pdf bibtex brut

Rubrique actualités du laboratoire

Résumé du communiqué de presse

Cette section est volontairement rédigée dans le style d'un communiqué de presse, sur un ton journalistique, à destination du grand public.

Amazon a publié une suite de nouveaux modèles de fondation d'IA appelée Amazon Nova, couvrant la génération de texte, d'images et de vidéos, et a détaillé leur conception et leurs performances dans un rapport technique d'accompagnement. La gamme comprend trois modèles de compréhension textuelle et multimodale — Nova Pro, Nova Lite et Nova Micro — ainsi que Nova Canvas pour la génération d'images et Nova Reel pour la génération de vidéos. Les modèles de compréhension reposent sur l'architecture Transformer et sont entraînés sur des données multilingues couvrant plus de 200 langues, à l'aide d'un pipeline qui passe du préentraînement à l'ajustement supervisé et à l'apprentissage par renforcement à partir de la rétroaction humaine via des méthodes comme DPO et PPO. Sur les bancs d'essai standards, les modèles rivalisent avec les offres comparables d'Anthropic, de Google et d'OpenAI : Nova Micro, le plus petit modèle exclusivement textuel, tient tête à des concurrents de taille similaire sur les tâches de mathématiques et de raisonnement, tandis que les modèles multimodaux Pro et Lite arrivent en tête ou en deuxième position sur le sous-titrage vidéo et plusieurs tests de navigation par agent web. Les modèles de génération d'images et de vidéos, Canvas et Reel, utilisent des architectures de diffusion latente et ont été évalués au moyen d'un mélange de métriques automatisées et d'études de préférence humaine. Fait notable, le rapport met l'accent sur des compromis pratiques — Nova Micro produit des réponses à 210 jetons par seconde contre 57 pour Claude 3.5 Sonnet — positionnant la famille comme compétitive sur le terrain du rapport prix-performance plutôt que sur la seule capacité brute. Le rapport documente également des mesures d'IA responsable, dont des exercices de red-teaming internes et externes et des tests adverses automatisés. Cette publication est importante car elle offre aux développeurs et aux chercheurs un compte rendu public détaillé de la manière dont la famille de modèles propriétaires d'un grand fournisseur de cloud se compare aux concurrents de pointe sur un large éventail de tâches du monde réel.

résumé

Nous présentons Amazon Nova, une nouvelle génération de modèles de fondation de pointe qui offrent une intelligence à la frontière de l'état de l'art et un rapport prix-performance leader du secteur. Amazon Nova Pro est un modèle multimodal très performant offrant la meilleure combinaison de précision, de rapidité et de coût pour un large éventail de tâches. Amazon Nova Lite est un modèle multimodal à faible coût d'une rapidité fulgurante pour le traitement d'images, de vidéos, de documents et de texte. Amazon Nova Micro est un modèle exclusivement textuel qui offre nos réponses à plus faible latence à très bas coût. Amazon Nova Canvas est un modèle de génération d'images qui crée des images de qualité professionnelle avec de riches contrôles de personnalisation. Amazon Nova Reel est un modèle de génération de vidéos offrant des sorties de haute qualité, de la personnalisation et un contrôle du mouvement. Nos modèles ont été conçus de manière responsable et avec un engagement envers la confiance, la sécurité et la fiabilité du client. Nous rapportons les résultats d'évaluation comparative pour les capacités fondamentales, la performance agentique, le contexte long, l'adaptation fonctionnelle, la performance à l'exécution et l'évaluation humaine.

détails

commentaire: 48 pages, 10 figures

citation

@article{agi2025amazon,
  title = {The Amazon Nova Family of Models: Technical Report and Model Card},
  author = {AGI, Amazon and authors, and 680 additional},
  year = {2025},
  journal = {arXiv preprint arXiv:2506.12103},
  url = {https://arxiv.org/abs/2506.12103},
}