The Amazon Nova Family of Models: Technical Report and Model Card
Sintesi del comunicato stampa
Amazon ha rilasciato una suite di nuovi foundation model di IA chiamata Amazon Nova, che spazia dalla generazione di testo, immagini e video, dettagliandone la progettazione e le prestazioni in un report tecnico di accompagnamento. La gamma include tre modelli di comprensione testuale e multimodale — Nova Pro, Nova Lite e Nova Micro — insieme a Nova Canvas per la generazione di immagini e Nova Reel per la generazione di video. I modelli di comprensione sono costruiti sull'architettura Transformer e addestrati su dati multilingue che coprono più di 200 lingue, utilizzando una pipeline che procede dal pretraining attraverso il fine-tuning supervisionato e l'apprendimento per rinforzo da feedback umano tramite metodi come DPO e PPO. Sui benchmark standard, i modelli se la giocano ad armi pari con offerte comparabili di Anthropic, Google e OpenAI: Nova Micro, il più piccolo modello solo testo, tiene testa a concorrenti di dimensioni simili su compiti di matematica e ragionamento, mentre i modelli multimodali Pro e Lite si collocano al primo o al secondo posto nella descrizione di video e in diversi test di navigazione con web-agent. I modelli di generazione di immagini e video, Canvas e Reel, utilizzano architetture a diffusione latente e sono stati valutati attraverso un mix di metriche automatiche e studi di preferenza umana. In particolare, il report sottolinea i compromessi pratici — Nova Micro produce risposte a 210 token al secondo rispetto ai 57 di Claude 3.5 Sonnet — posizionando la famiglia come competitiva sul piano del rapporto prezzo-prestazioni anziché solo sulla capacità grezza. Il report documenta inoltre misure di IA responsabile, tra cui red-teaming interno ed esterno e test avversariali automatizzati. Il rilascio è importante perché offre a sviluppatori e ricercatori un resoconto pubblico dettagliato di come la famiglia di modelli proprietari di un grande fornitore cloud si confronti con i concorrenti di frontiera su un'ampia gamma di compiti del mondo reale.
abstract
Presentiamo Amazon Nova, una nuova generazione di foundation model allo stato dell'arte che offrono un'intelligenza di frontiera e un rapporto prezzo-prestazioni leader del settore. Amazon Nova Pro è un modello multimodale altamente capace con la migliore combinazione di accuratezza, velocità e costo per un'ampia gamma di compiti. Amazon Nova Lite è un modello multimodale a basso costo che è fulmineo nell'elaborazione di immagini, video, documenti e testo. Amazon Nova Micro è un modello solo testo che fornisce le nostre risposte a più bassa latenza a un costo molto contenuto. Amazon Nova Canvas è un modello di generazione di immagini che crea immagini di livello professionale con ricchi controlli di personalizzazione. Amazon Nova Reel è un modello di generazione di video che offre output di alta qualità, personalizzazione e controllo del movimento. I nostri modelli sono stati costruiti in modo responsabile e con un impegno verso la fiducia, la sicurezza e l'affidabilità per i clienti. Riportiamo i risultati di benchmark per le capacità fondamentali, le prestazioni agentiche, il lungo contesto, l'adattamento funzionale, le prestazioni a runtime e la valutazione umana.
dettagli
citazione
@article{agi2025amazon,
title = {The Amazon Nova Family of Models: Technical Report and Model Card},
author = {AGI, Amazon and authors, and 680 additional},
year = {2025},
journal = {arXiv preprint arXiv:2506.12103},
url = {https://arxiv.org/abs/2506.12103},
}