The Amazon Nova Family of Models: Technical Report and Model Card
preprint

The Amazon Nova Family of Models: Technical Report and Model Card

Amazon AGI, and 680 additional authors.
arXiv:2506.12103 March 2025.
Mesa de noticias del laboratorio

Resumen de prensa

Esta sección está escrita intencionadamente con un tono de nota de prensa, en estilo periodístico, para el público general.

Amazon ha lanzado un conjunto de nuevos modelos fundacionales de IA llamado Amazon Nova, que abarca la generación de texto, imágenes y video, y ha detallado su diseño y rendimiento en un informe técnico complementario. La línea incluye tres modelos de comprensión de texto y multimodal —Nova Pro, Nova Lite y Nova Micro— junto con Nova Canvas para la generación de imágenes y Nova Reel para la generación de video. Los modelos de comprensión se construyen sobre la arquitectura Transformer y se entrenan con datos multilingües que cubren más de 200 idiomas, utilizando una canalización que va desde el preentrenamiento hasta el ajuste fino supervisado y el aprendizaje por refuerzo a partir de retroalimentación humana mediante métodos como DPO y PPO. En las pruebas comparativas estándar, los modelos compiten de tú a tú con ofertas equivalentes de Anthropic, Google y OpenAI: Nova Micro, el modelo más pequeño solo de texto, se defiende bien frente a competidores de tamaño similar en tareas de matemáticas y razonamiento, mientras que los modelos multimodales Pro y Lite lideran o quedan en segundo lugar en la descripción de video y en varias pruebas de navegación de agentes web. Los modelos de generación de imágenes y video, Canvas y Reel, utilizan arquitecturas de difusión latente y se evaluaron mediante una combinación de métricas automatizadas y estudios de preferencia humana. Cabe destacar que el informe enfatiza compensaciones prácticas —Nova Micro produce respuestas a 210 tokens por segundo en comparación con los 57 de Claude 3.5 Sonnet—, posicionando a la familia como competitiva en términos de rendimiento por precio más que por capacidad en bruto por sí sola. El informe también documenta medidas de IA responsable, incluyendo pruebas internas y externas de equipos rojos (red-teaming) y pruebas adversariales automatizadas. El lanzamiento es importante porque ofrece a desarrolladores e investigadores un detallado recuento público de cómo se compara la familia de modelos propietarios de un importante proveedor de la nube con los competidores de frontera en una amplia gama de tareas del mundo real.

resumen

Presentamos Amazon Nova, una nueva generación de modelos fundacionales de vanguardia que ofrecen inteligencia de frontera y un rendimiento por precio líder en la industria. Amazon Nova Pro es un modelo multimodal altamente capaz con la mejor combinación de precisión, velocidad y costo para una amplia variedad de tareas. Amazon Nova Lite es un modelo multimodal de bajo costo y extremadamente rápido para procesar imágenes, video, documentos y texto. Amazon Nova Micro es un modelo solo de texto que ofrece nuestras respuestas de menor latencia a un costo muy bajo. Amazon Nova Canvas es un modelo de generación de imágenes que crea imágenes de calidad profesional con amplios controles de personalización. Amazon Nova Reel es un modelo de generación de video que ofrece resultados de alta calidad, personalización y control de movimiento. Nuestros modelos se construyeron de manera responsable y con un compromiso con la confianza, la seguridad y la fiabilidad del cliente. Reportamos resultados de evaluación comparativa para capacidades fundamentales, rendimiento agéntico, contexto largo, adaptación funcional, rendimiento en tiempo de ejecución y evaluación humana.

detalles

comentario
48 pages, 10 figures

cita

@article{agi2025amazon,
  title = {The Amazon Nova Family of Models: Technical Report and Model Card},
  author = {AGI, Amazon and authors, and 680 additional},
  year = {2025},
  journal = {arXiv preprint arXiv:2506.12103},
  url = {https://arxiv.org/abs/2506.12103},
}