プレスリリース要約
Amazonは、テキスト、画像、動画の生成にまたがるAmazon Novaと呼ばれる新しいAI基盤モデル群を公開し、付随する技術報告書でその設計と性能を詳述した。このラインアップには、テキストおよびマルチモーダル理解モデルであるNova Pro、Nova Lite、Nova Microの三つに加え、画像生成のためのNova Canvasと動画生成のためのNova Reelが含まれる。理解モデルはTransformerアーキテクチャの上に構築され、200を超える言語を網羅する多言語データで訓練されており、事前学習から教師ありファインチューニング、そしてDPOやPPOといった手法による人間のフィードバックからの強化学習へと進むパイプラインを用いている。標準的なベンチマークでは、これらのモデルはAnthropic、Google、OpenAIの同等の製品と互角に渡り合っている。最小のテキスト専用モデルであるNova Microは数学および推論タスクで同程度の規模の競合と互角に渡り合い、マルチモーダルのProおよびLiteモデルは動画キャプション生成といくつかのウェブエージェントのナビゲーションテストで首位または二位に位置している。画像および動画生成モデルであるCanvasとReelは潜在拡散アーキテクチャを用いており、自動指標と人間の選好調査の組み合わせを通じて評価された。注目すべきことに、この報告書は実用的なトレードオフを強調しており、Nova MicroはClaude 3.5 Sonnetの毎秒57トークンに対し毎秒210トークンで応答を生成し、生の能力だけでなく価格性能の面で競争力のあるものとしてこのモデル群を位置づけている。報告書はまた、内部および外部のレッドチーミングや自動化された敵対的テストを含む責任あるAIの方策を文書化している。この公開が重要なのは、大手クラウドプロバイダの独自モデル群が幅広い実世界タスクにわたって最先端の競合と比較してどうであるかについて、開発者と研究者に詳細な公開の説明を与えるからである。
要旨
我々は、最先端の知能と業界をリードする価格性能をもたらす新世代の最先端基盤モデルであるAmazon Novaを発表する。Amazon Nova Proは、幅広いタスクにおいて精度、速度、コストの最良の組み合わせを備えた、極めて高性能なマルチモーダルモデルである。Amazon Nova Liteは、画像、動画、文書、テキストの処理が電光石火のごとく速い、低コストのマルチモーダルモデルである。Amazon Nova Microは、極めて低いコストで最も低遅延の応答をもたらすテキスト専用モデルである。Amazon Nova Canvasは、豊富なカスタマイズ制御を備えてプロ品質の画像を作成する画像生成モデルである。Amazon Nova Reelは、高品質な出力、カスタマイズ、モーション制御を提供する動画生成モデルである。我々のモデルは責任を持って、また顧客の信頼、セキュリティ、信頼性への確固たる取り組みのもとに構築された。我々は、中核的な能力、エージェント性能、長文脈、機能的適応、実行時性能、および人間による評価についてのベンチマーク結果を報告する。
詳細
引用
@article{agi2025amazon,
title = {The Amazon Nova Family of Models: Technical Report and Model Card},
author = {AGI, Amazon and authors, and 680 additional},
year = {2025},
journal = {arXiv preprint arXiv:2506.12103},
url = {https://arxiv.org/abs/2506.12103},
}