The Amazon Nova Family of Models: Technical Report and Model Card
Resumo do comunicado de imprensa
A Amazon lançou um conjunto de novos modelos de fundação de IA chamado Amazon Nova, abrangendo geração de texto, imagem e vídeo, e detalhou seu projeto e desempenho em um relatório técnico que o acompanha. A linha inclui três modelos de compreensão de texto e multimodal — Nova Pro, Nova Lite e Nova Micro — junto com o Nova Canvas para geração de imagens e o Nova Reel para geração de vídeo. Os modelos de compreensão são construídos sobre a arquitetura Transformer e treinados em dados multilíngues que cobrem mais de 200 idiomas, usando um pipeline que vai do pré-treinamento ao ajuste fino supervisionado e ao aprendizado por reforço a partir de feedback humano por meio de métodos como DPO e PPO. Em benchmarks padrão, os modelos se equiparam a ofertas comparáveis da Anthropic, da Google e da OpenAI: o Nova Micro, o menor modelo apenas de texto, se mantém à altura de concorrentes de tamanho semelhante em tarefas de matemática e raciocínio, enquanto os modelos multimodais Pro e Lite lideram ou ficam em segundo lugar em legendagem de vídeo e em vários testes de navegação por agentes web. Os modelos de geração de imagem e vídeo, Canvas e Reel, usam arquiteturas de difusão latente e foram avaliados por meio de uma combinação de métricas automatizadas e estudos de preferência humana. Notavelmente, o relatório enfatiza compensações práticas — o Nova Micro produz respostas a 210 tokens por segundo em comparação com os 57 do Claude 3.5 Sonnet — posicionando a família como competitiva em termos de relação preço-desempenho, e não apenas de capacidade bruta. O relatório também documenta medidas de IA responsável, incluindo red-teaming interno e externo e testes adversariais automatizados. O lançamento é relevante porque dá a desenvolvedores e pesquisadores uma prestação de contas pública detalhada de como a família de modelos proprietários de um grande provedor de nuvem se compara aos concorrentes de fronteira em uma ampla gama de tarefas do mundo real.
resumo
Apresentamos o Amazon Nova, uma nova geração de modelos de fundação de ponta que oferecem inteligência de fronteira e relação preço-desempenho líder do setor. O Amazon Nova Pro é um modelo multimodal altamente capaz com a melhor combinação de acurácia, velocidade e custo para uma ampla gama de tarefas. O Amazon Nova Lite é um modelo multimodal de baixo custo que é extremamente rápido no processamento de imagens, vídeo, documentos e texto. O Amazon Nova Micro é um modelo apenas de texto que oferece nossas respostas de menor latência a um custo muito baixo. O Amazon Nova Canvas é um modelo de geração de imagens que cria imagens de qualidade profissional com ricos controles de personalização. O Amazon Nova Reel é um modelo de geração de vídeo que oferece saídas de alta qualidade, personalização e controle de movimento. Nossos modelos foram construídos de forma responsável e com um compromisso com a confiança, a segurança e a confiabilidade do cliente. Relatamos resultados de benchmark para capacidades centrais, desempenho agêntico, contexto longo, adaptação funcional, desempenho em tempo de execução e avaliação humana.
detalhes
citação
@article{agi2025amazon,
title = {The Amazon Nova Family of Models: Technical Report and Model Card},
author = {AGI, Amazon and authors, and 680 additional},
year = {2025},
journal = {arXiv preprint arXiv:2506.12103},
url = {https://arxiv.org/abs/2506.12103},
}