The Amazon Nova Family of Models: Technical Report and Model Card
preprint

The Amazon Nova Family of Models: Technical Report and Model Card

Amazon AGI, and 680 additional authors.
arXiv:2506.12103 March 2025.
Redazione notizie del laboratorio

Sintesi del comunicato stampa

Questa sezione è scritta volutamente con il tono di un comunicato stampa giornalistico, destinato al pubblico generale.

Amazon ha rilasciato una suite di nuovi foundation model di IA chiamata Amazon Nova, che spazia dalla generazione di testo, immagini e video, dettagliandone la progettazione e le prestazioni in un report tecnico di accompagnamento. La gamma include tre modelli di comprensione testuale e multimodale — Nova Pro, Nova Lite e Nova Micro — insieme a Nova Canvas per la generazione di immagini e Nova Reel per la generazione di video. I modelli di comprensione sono costruiti sull'architettura Transformer e addestrati su dati multilingue che coprono più di 200 lingue, utilizzando una pipeline che procede dal pretraining attraverso il fine-tuning supervisionato e il Reinforcement Learning da feedback umano tramite metodi come DPO e PPO. Sui benchmark standard, i modelli se la giocano ad armi pari con offerte comparabili di Anthropic, Google e OpenAI: Nova Micro, il più piccolo modello solo testo, tiene testa a concorrenti di dimensioni simili su compiti di matematica e ragionamento, mentre i modelli multimodali Pro e Lite si collocano al primo o al secondo posto nella descrizione di video e in diversi test di navigazione con web-agent. I modelli di generazione di immagini e video, Canvas e Reel, utilizzano architetture a diffusione latente e sono stati valutati attraverso un mix di metriche automatiche e studi di preferenza umana. In particolare, il report sottolinea i compromessi pratici — Nova Micro produce risposte a 210 token al secondo rispetto ai 57 di Claude 3.5 Sonnet — posizionando la famiglia come competitiva sul piano del rapporto prezzo-prestazioni anziché solo sulla capacità grezza. Il report documenta inoltre misure di IA responsabile, tra cui red-teaming interno ed esterno e test avversariali automatizzati. Il rilascio è importante perché offre a sviluppatori e ricercatori un resoconto pubblico dettagliato di come la famiglia di modelli proprietari di un grande fornitore cloud si confronti con i concorrenti di frontiera su un'ampia gamma di compiti del mondo reale.

abstract

Presentiamo Amazon Nova, una nuova generazione di foundation model allo stato dell'arte che offrono un'intelligenza di frontiera e un rapporto prezzo-prestazioni leader del settore. Amazon Nova Pro è un modello multimodale altamente capace con la migliore combinazione di accuratezza, velocità e costo per un'ampia gamma di compiti. Amazon Nova Lite è un modello multimodale a basso costo che è fulmineo nell'elaborazione di immagini, video, documenti e testo. Amazon Nova Micro è un modello solo testo che fornisce le nostre risposte a più bassa latenza a un costo molto contenuto. Amazon Nova Canvas è un modello di generazione di immagini che crea immagini di livello professionale con ricchi controlli di personalizzazione. Amazon Nova Reel è un modello di generazione di video che offre output di alta qualità, personalizzazione e controllo del movimento. I nostri modelli sono stati costruiti in modo responsabile e con un impegno verso la fiducia, la sicurezza e l'affidabilità per i clienti. Riportiamo i risultati di benchmark per le capacità fondamentali, le prestazioni agentiche, il lungo contesto, l'adattamento funzionale, le prestazioni a runtime e la valutazione umana.

dettagli

commento
48 pages, 10 figures

citazione

@article{agi2025amazon,
  title = {The Amazon Nova Family of Models: Technical Report and Model Card},
  author = {AGI, Amazon and authors, and 680 additional},
  year = {2025},
  journal = {arXiv preprint arXiv:2506.12103},
  url = {https://arxiv.org/abs/2506.12103},
}