The Amazon Nova Family of Models: Technical Report and Model Card
Tóm tắt thông cáo báo chí
Amazon đã phát hành một bộ các mô hình nền tảng AI mới gọi là Amazon Nova, trải dài qua việc sinh văn bản, ảnh, và video, và trình bày chi tiết thiết kế cùng hiệu năng của chúng trong một báo cáo kỹ thuật đi kèm. Bộ này bao gồm ba mô hình hiểu văn bản-và-đa-phương-thức — Nova Pro, Nova Lite, và Nova Micro — cùng với Nova Canvas để sinh ảnh và Nova Reel để sinh video. Các mô hình hiểu được xây dựng trên kiến trúc Transformer và được huấn luyện trên dữ liệu đa ngôn ngữ bao phủ hơn 200 ngôn ngữ, sử dụng một quy trình đi từ tiền huấn luyện qua tinh chỉnh có giám sát và Reinforcement Learning từ phản hồi của con người thông qua các phương pháp như DPO và PPO. Trên các benchmark tiêu chuẩn, các mô hình ngang ngửa với các sản phẩm tương đương từ Anthropic, Google, và OpenAI: Nova Micro, mô hình chỉ-văn-bản nhỏ nhất, đứng vững trước các đối thủ có kích thước tương tự trên các tác vụ toán học và suy luận, trong khi các mô hình đa phương thức Pro và Lite dẫn đầu hoặc đứng thứ hai trên việc chú thích video và một số bài kiểm tra điều hướng tác nhân web. Các mô hình sinh ảnh và video, Canvas và Reel, sử dụng các kiến trúc khuếch tán tiềm ẩn và được đánh giá thông qua một sự pha trộn giữa các chỉ số tự động và các nghiên cứu sở thích của con người. Đáng chú ý, báo cáo nhấn mạnh các sự đánh đổi thực tiễn — Nova Micro tạo ra các phản hồi ở 210 token mỗi giây so với 57 của Claude 3.5 Sonnet — định vị họ mô hình này là cạnh tranh trên cơ sở hiệu năng giá cả thay vì chỉ năng lực thuần túy. Báo cáo cũng ghi lại các biện pháp AI có trách nhiệm bao gồm red-teaming nội bộ và bên ngoài và kiểm thử đối kháng tự động. Sự phát hành này có ý nghĩa vì nó mang lại cho các nhà phát triển và nhà nghiên cứu một bản kê khai công khai chi tiết về cách họ mô hình độc quyền của một nhà cung cấp đám mây lớn so sánh với các đối thủ tiên phong qua một loạt rộng các tác vụ thực tế.
tóm tắt
Chúng tôi giới thiệu Amazon Nova, một thế hệ mới các mô hình nền tảng tốt nhất hiện nay mang lại trí tuệ tiên phong và hiệu năng giá cả dẫn đầu ngành. Amazon Nova Pro là một mô hình đa phương thức có năng lực cao với sự kết hợp tốt nhất giữa độ chính xác, tốc độ, và chi phí cho một loạt các tác vụ rộng. Amazon Nova Lite là một mô hình đa phương thức chi phí thấp, nhanh như chớp trong việc xử lý ảnh, video, tài liệu, và văn bản. Amazon Nova Micro là một mô hình chỉ-văn-bản mang lại các phản hồi có độ trễ thấp nhất của chúng tôi với chi phí rất thấp. Amazon Nova Canvas là một mô hình sinh ảnh tạo ra các ảnh cấp độ chuyên nghiệp với các điều khiển tùy chỉnh phong phú. Amazon Nova Reel là một mô hình sinh video cung cấp các đầu ra chất lượng cao, khả năng tùy chỉnh, và điều khiển chuyển động. Các mô hình của chúng tôi được xây dựng một cách có trách nhiệm và với cam kết về sự tin tưởng, bảo mật, và độ tin cậy của khách hàng. Chúng tôi báo cáo các kết quả kiểm chuẩn cho các năng lực cốt lõi, hiệu năng tác tử, ngữ cảnh dài, sự thích ứng theo chức năng, hiệu năng thời gian chạy, và đánh giá của con người.
chi tiết
trích dẫn
@article{agi2025amazon,
title = {The Amazon Nova Family of Models: Technical Report and Model Card},
author = {AGI, Amazon and authors, and 680 additional},
year = {2025},
journal = {arXiv preprint arXiv:2506.12103},
url = {https://arxiv.org/abs/2506.12103},
}