OpenAIのCEOが「o2が博士号レベルのベンチマークで105%のスコアを達成」とSNSに投稿、次期AIモデルはGPT-4oでも53.6%しか記録できなかった高難度テストで約2倍のスコアを達成か
OpenAIのサム・アルトマンCEOが自身のXアカウントに「o2がGPQAで105%のスコアを達成したと聞いた」と2024年11月3日(日)に投稿しました。「o2」の正式名称は不明ですが、OpenAIが開発中の次世代AIモデルが驚異的な性能を備えている可能性が濃厚となっています。
i heard o2 gets 105% on GPQA— Sam Altman (@sama) November 2, 2024
GPQAはAIの性能を測定するベンチマークの1種で、生物学・物理学・化学の専門家が作成した448問の選択問題で構成されています。GPQAの問題はかなりの高難度で、「専門家でない人間」がGoogle検索を駆使して挑んだ場合は34%、「博士号保持者または博士号の取得を目指す学生」の場合も65%のスコアしか獲得できません。
GPQAはすでに各種高性能AIのベンチマークとして利用されており、GPT-4oは53.6%、Claude3 Opusは50.4%、Llama3 400bは48.0%のスコアを記録しています。アルトマンCEOが述べた「105%」という数字は既存のAIのスコアを大きく上回るものであり、「o2」と呼ばれるAIモデルが博士号保持者を超える回答能力を備えていることが示唆されています。
アルトマンCEOが言及した「o2」は「GPT-4o」や「OpenAI o1」の後継モデルと推測できます。「o2」の登場時期は不明ですが、アルトマンCEOは2024年11月1日(金)に「複数の製品を2025年中にリリース予定」と発言しています。ただし、アルトマンCEOは「GPT-5を2025年中にリリースする計画はない」と言及しているほか、一部メディアが報道していた「次世代AIモデル『Orion』の2024年中のリリース」についてもOpenAIが否定声明を発表しています。
OpenAIのCEOがネット掲示板に降臨し「GPT-5は2024年中に登場しない」「複数の製品を2024年中に発表する」「AGIは既存のハードウェアで実現可能」など重要情報を次々に投下 - GIGAZINE
なお、アルトマンCEOは問題の投稿の直後に「しまった。アカウントをミスった」と投稿しています。
damn, wrong account— Sam Altman (@sama) November 2, 2024
11/03 09:59
GIGAZINE