GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場

GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場 - 画像


AI企業・Inflectionが開発している生成AI「Pi」は、ユーザーひとりひとりに最適化された「パーソナルAI」です。そんなPiの能力を飛躍的に向上させた基盤モデルである「Inflection-2.5」をInflectionが発表しました。
Inflection-2.5: meet the world's best personal AI
https://inflection.ai/inflection-2-5
PiはAndroidやiOSのスマートフォン、ブラウザなどを通じて会話する事が可能なAIで、日本語にも対応しています。

GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場 - 画像


Inflectionによると、Piはデイリーアクティブユーザー数100万人、月間アクティブユーザー数400万人の利用者を抱えているとのこと。また、平均会話時間は33分で、10人に1人は1時間以上話し込んだり、使ったユーザーの60%は翌週にまたPiを使っていたりと、利用者の満足度の指標で競合サービスより高いスコアを出しています。

GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場 - 画像


Piの人気を支えているのが、Piに搭載されている基盤モデルのInflection-2.5です。Inflection-2.5はトレーニングに費やされたコンピューティング量がGPT-4の40%、前モデルであるInflection-1に至ってはGPT-4の4%しかないにもかかわらず、マルチタスク性能を測定するMMLU(Massive Multi-task Language Understanding)や大学院レベルの知識を要求するGoogleのベンチマークGPQA(Baselines and analysis for the Google-proof Q&A)の最高位のデータセットであるDiamondでGPT-4に匹敵するスコアを示しました。

GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場 - 画像


Inflection-2.5は、AIの数的処理の能力を推し量るのに使われるハンガリーの数学試験(Hungarian Math)や、北米で使われる共通試験「GRE」の物理学問題(Physics GRE)といったSTEM分野でも強みを見せています。

GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場 - 画像


Inflection-2.5は理数の分野だけでなく、コーディングでも優れた成績を収めており、コーディングベンチマークであるMBPP+とHumanEval+ではInflection-1からスコアが大幅に改善されました。

GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場 - 画像


これらのベンチマークスコアをInflection-1(黄緑色)、Inflection-2.5(緑色)、GPT-4(灰色)の棒グラフで比較すると以下のようになります。

GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場 - 画像


Inflectionは「つまり、Inflection-2.5はPiのユニークで親しみやすい性格と並外れた安全基準を維持しながら、全体的にさらに有用なモデルになりました」と述べました。

ジャンルで探す