The Amazon Nova Family of Models: Technical Report and Model Card
Zusammenfassung der Pressemitteilung
Amazon hat eine Reihe neuer KI-Foundation-Modelle namens Amazon Nova veröffentlicht, die Text-, Bild- und Videogenerierung umfasst, und ihr Design und ihre Leistung in einem begleitenden technischen Bericht im Detail dargelegt. Die Produktlinie umfasst drei Modelle für Text- und multimodales Verständnis – Nova Pro, Nova Lite und Nova Micro – sowie Nova Canvas für die Bildgenerierung und Nova Reel für die Videogenerierung. Die Verständnismodelle basieren auf der Transformer-Architektur und werden auf mehrsprachigen Daten trainiert, die mehr als 200 Sprachen abdecken, wobei eine Pipeline verwendet wird, die vom Pretraining über überwachtes Fine-Tuning bis hin zum Reinforcement Learning aus menschlichem Feedback über Methoden wie DPO und PPO reicht. Auf Standard-Benchmarks halten die Modelle mit vergleichbaren Angeboten von Anthropic, Google und OpenAI Schritt: Nova Micro, das kleinste reine Textmodell, behauptet sich gegen ähnlich große Konkurrenten bei Mathematik- und Reasoning-Aufgaben, während die multimodalen Modelle Pro und Lite bei Video-Captioning und mehreren Web-Agenten-Navigationstests führen oder den zweiten Platz belegen. Die Bild- und Videogenerierungsmodelle Canvas und Reel verwenden Latent-Diffusion-Architekturen und wurden anhand einer Mischung aus automatisierten Metriken und Studien zu menschlichen Präferenzen evaluiert. Bemerkenswerterweise betont der Bericht praktische Kompromisse – Nova Micro erzeugt Antworten mit 210 Tokens pro Sekunde gegenüber 57 bei Claude 3.5 Sonnet – und positioniert die Familie als wettbewerbsfähig auf Grundlage des Preis-Leistungs-Verhältnisses statt allein der reinen Leistungsfähigkeit. Der Bericht dokumentiert außerdem Maßnahmen für verantwortungsvolle KI, einschließlich internem und externem Red-Teaming sowie automatisierten adversariellen Tests. Die Veröffentlichung ist von Bedeutung, weil sie Entwicklern und Forschenden eine detaillierte öffentliche Darstellung dessen liefert, wie sich die proprietäre Modellfamilie eines großen Cloud-Anbieters über ein breites Spektrum realer Aufgaben hinweg mit wegweisenden Konkurrenten vergleicht.
Zusammenfassung
Wir präsentieren Amazon Nova, eine neue Generation von State-of-the-Art-Foundation-Modellen, die wegweisende Intelligenz und branchenführendes Preis-Leistungs-Verhältnis bieten. Amazon Nova Pro ist ein hochleistungsfähiges multimodales Modell mit der besten Kombination aus Genauigkeit, Geschwindigkeit und Kosten für ein breites Aufgabenspektrum. Amazon Nova Lite ist ein kostengünstiges multimodales Modell, das blitzschnell Bilder, Videos, Dokumente und Text verarbeitet. Amazon Nova Micro ist ein reines Textmodell, das unsere latenzärmsten Antworten zu sehr niedrigen Kosten liefert. Amazon Nova Canvas ist ein Bildgenerierungsmodell, das Bilder in professioneller Qualität mit umfangreichen Anpassungssteuerungen erstellt. Amazon Nova Reel ist ein Videogenerierungsmodell, das hochwertige Ausgaben, Anpassung und Bewegungssteuerung bietet. Unsere Modelle wurden verantwortungsvoll und mit einem Bekenntnis zu Kundenvertrauen, Sicherheit und Zuverlässigkeit entwickelt. Wir berichten Benchmark-Ergebnisse für Kernfähigkeiten, agentische Leistung, langen Kontext, funktionale Anpassung, Laufzeitleistung und menschliche Evaluation.
Details
Zitation
@article{agi2025amazon,
title = {The Amazon Nova Family of Models: Technical Report and Model Card},
author = {AGI, Amazon and authors, and 680 additional},
year = {2025},
journal = {arXiv preprint arXiv:2506.12103},
url = {https://arxiv.org/abs/2506.12103},
}