無料で商用利用可能なオープンモデル「Mixtral 8x22B」が登場、高いコーディングと数学の能力を持つ

無料で商用利用可能なオープンモデル「Mixtral 8x22B」が登場、高いコーディングと数学の能力を持つ - 画像


GoogleやMetaの研究者によって設立されたAIスタートアップのMistral AIが、オープンソースの大規模言語モデル「Mixtral 8x22B」をリリースしました。モデルはオープンソースライセンスのApache 2.0で提供されており、商用利用も可能となっています。
Cheaper, Better, Faster, Stronger | Mistral AI | Frontier AI in your hands
https://mistral.ai/news/mixtral-8x22b/
Mixtral 8x22Bのモデルは4月10日に公式Xアカウントにて公表・配布されていましたが、詳細な情報は不明となっていました。今回はMixtral 8x22Bモデルについての公式リリースが発表されたというわけです。
Mistral AIが突如として新しい大規模言語モデル「8x22B MOE」を発表、コンテキスト長65kでパラメーターサイズは最大1760億か - GIGAZINE

無料で商用利用可能なオープンモデル「Mixtral 8x22B」が登場、高いコーディングと数学の能力を持つ - 画像


Mixtral 8x22Bは疎な専門家混合モデル(SMoE)となっており、推論ごとに1410億(141B)のうち390億(39B)パラメーターだけを使用することでパラメーターのサイズに比べてはるかに優れたコスト効率をたたき出しています。
ウェイトが公開されている主要なオープンモデルとのコストパフォーマンスの比較は下図の通り。今回リリースされたMixtral 8x22Bはコストであるアクティブパラメーターの数を抑えつつ高いパフォーマンスを維持できていることが分かります。

無料で商用利用可能なオープンモデル「Mixtral 8x22B」が登場、高いコーディングと数学の能力を持つ - 画像


主要オープンモデルとのベンチマークの比較は下図の通り。ほとんどの指標でこれまでのモデルを上回りました。

無料で商用利用可能なオープンモデル「Mixtral 8x22B」が登場、高いコーディングと数学の能力を持つ - 画像


Mixtral 8x22Bは英語以外にも「フランス語」「イタリア語」「ドイツ語」「スペイン語」に対応しています。英語以外の言語でもMistral AIがリリースした過去のモデルやLLaMA 2 70Bなどを超える性能を発揮しているとのこと。

無料で商用利用可能なオープンモデル「Mixtral 8x22B」が登場、高いコーディングと数学の能力を持つ - 画像


また、強力な数学やコーディングの能力を備えています。

無料で商用利用可能なオープンモデル「Mixtral 8x22B」が登場、高いコーディングと数学の能力を持つ - 画像


Mixtral 8x22Bはネイティブな関数呼び出しが可能で、コンテキストウィンドウは6万4000(64K)トークンとのこと。モデルはオープンソースライセンスのApache 2.0で公開されるため、無料で商用利用することが可能となっています。

ジャンルで探す