AmazonがAWS上で利用可能なマルチモーダル生成AIモデル「Amazon Nova」を発表


Amazonのクラウドコンピューティング部門であるAmazon Web Services(AWS)は、2024年12月2日からラスベガスで開催されているイベント「re:Invent 2024」で、独自のマルチモーダル生成AIモデル「Amazon Nova」を発表しました。Amazon Novaは複数モデルが用意されており、そのうち3モデルは12月3日からAWSの顧客向けに提供されます。
Introducing Amazon Nova: Frontier intelligence and industry leading price performance | AWS News Blog
https://aws.amazon.com/jp/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/


Amazon Nova: Meet our new foundation models in Amazon Bedrock
https://www.aboutamazon.com/news/aws/amazon-nova-artificial-intelligence-bedrock-aws
Amazon announces Nova, a new family of multimodal AI models | TechCrunch
https://techcrunch.com/2024/12/03/amazon-announces-nova-a-new-family-of-multimodal-ai-models/
Amazon unveils 'Nova' AI models, looking to make its mark in the generative AI revolution – GeekWire
https://www.geekwire.com/2024/amazon-unveils-nova-ai-models/
AWSは「Amazon Novaを使うことで、ほぼすべての生成AIタスクのコストとレイテンシーを削減できます。Amazon Novaを基盤として、エンタープライズワークロード向けに最適化されたさまざまなインテリジェンスクラスから、複雑な文書や映像の分析、チャートや図の理解、魅力的な映像コンテンツの生成、洗練されたAIエージェントの構築が可能です」と述べています。
Amazon Novaは理解(Understanding)モデルとクリエイティブコンテンツモデルの2種類があり、AWS上で生成AIを利用可能にするサービス「Amazon BedRock」で提供される予定です。
理解モデルは以下の4つ。理解モデルは200以上の言語に対応する他言語モデルで、特に英語、ドイツ語、スペイン語、フランス語、イタリア語、日本語、韓国語、アラビア語、簡体字中国語、ロシア語、ヒンディー語、ポルトガル語、オランダ語、トルコ語、ヘブライ語において特に高い性能を発揮するとのこと。
・Amazon Nova Micro
テキストのみを処理する低コスト・低レイテンシーのモデルで、12万8000トークンのコンテキスト長を持ち、テキスト要約、翻訳、コンテンツ分類、チャット、簡単な数学的推論とコーディングを効率的に実行できます。独自データでのファインチューニングとモデル蒸留もサポート。
・Amazon Nova Lite
画像・映像・テキスト入力を超高速で処理する、低コストのマルチモーダルモデル。30万トークンまでの入力を処理でき、1回のリクエストで複数の画像や最大30分の動画を分析可能で、テキストとマルチモーダルの両方でファインチューニングが可能となっています。
・Amazon Nova Pro
精度、速度、コストの最適なバランスを実現した高性能マルチモーダルモデルです。30万トークンまでの入力処理が可能で、APIやツールを使用する複雑なワークフローを実行できます。特に財務文書の分析に優れており、1万5000行以上のコードベースも処理できます。
・Amazon Nova Premier
単独で使用するモデルよりは、複雑な推論タスクに対応してカスタムモデルを抽出するための最適な「教師」モデルとしての使用を想定した最上位モデル。
クリエイティブコンテンツモデルは以下の2つ。記事作成時点では英語のプロンプトのみをサポートしているとのこと。
・Amazon Nova Canvas
スタジオ品質の画像を作成できる画像生成モデルで、スタイルやコンテンツを正確にコントロール可能。以下は実際にAmazon Nova Canvasに入力したプロンプトと生成した画像です。


・Amazon Nova Reel
テキストプロンプトと画像から短編動画を生成可能。視覚的スタイルやペースを調整でき、マーケティングや広告、エンターテインメント向けのプロフェッショナル品質の動画を作成可能な動画生成モデル。Amazon Nova Reelで生成した動画がどんな感じなのかは以下のムービーを見るとよくわかります。
Amazon Nova Reel | Amazon Web Services - YouTube

AWSによると、Amazon Novaの全モデルには安全性とコンテンツモデレーション機能が組み込まれており、特にクリエイティブコンテンツモデルにはウォーターマーク機能が備わっているとのこと。これにより、責任あるAI利用を促進し、不適切なコンテンツの生成を防ぐ仕組みを整備しているとAWSはアピールしています。
Amazon Novaのうち、「Amazon Nova Micro」「Amazon Nova Lite」「Amazon Nova Pro」「Amazon Nova Canvas」「Amazon Nova Reel」は2024年12月3日から利用可能となっており、「Amazon Nova Premier」は2025年第1四半期(1月~3月)にリリースが予定されています。
Amazon Novaは主にAWSのアメリカ東部(バージニア北部)リージョンで利用可能で、Micro・Lite・Proの3モデルについては、クロスリージョン推論を通じてアメリカ西部(オレゴン)およびアメリカ東部(オハイオ)リージョンでも利用できるそうです。価格設定については、他のAmazon Bedrockサービスと同様に従量課金制(pay-as-you-go)モデルを採用しており、実際の使用量に応じて料金が発生します。
さらに、Amazonは2025年に向けて、Amazon Novaモデルを2種類追加で導入する予定を発表しました。1つは「スピーチ・トゥ・スピーチモデル」で、音声入力を自然言語で理解し、トーンやリズムなどの言語的・非言語的キューを解釈することで、より自然な人間らしい対話を実現することを目指しているとのこと。
2つ目は「ネイティブマルチモーダル・トゥ・マルチモーダルモデル」、別名「any-to-any」モダリティモデルです。これはテキスト・画像・音声・動画といった異なる形式のデータを、入力と出力の両方で処理することができます。これにより、異なるモダリティ間でのコンテンツ変換やコンテンツ編集、さらにはすべてのモダリティを理解・生成できるAIエージェントの実現が可能になります。


AWSは、これらの開発を「始まりに過ぎない」と述べ、2つのモデルが追加導入されることで、単一のモデルで幅広いタスクを実行できるようになり、アプリケーション開発が大幅に簡素化されることに期待しています。そして、今後も顧客に実際の価値を届けるためのイノベーションを継続していく姿勢を示しました。

ジャンルで探す