GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


Googleの技術研究部門であるGoogle ResearchとAI部門のGoogle DeepMindが、2023年におけるAIとコンピューティングについて発表したさまざまなAIモデルや研究成果を振り返っています。
2023: A year of groundbreaking advances in AI and computing – Google Research Blog
https://blog.research.google/2023/12/2023-year-of-groundbreaking-advances-in.html

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


Googleは2023年3月21日に、チャットボットAIのBardを公開しました。このBardはテキストの生成、言語の翻訳などさまざまなコンテンツを作成できます。
GoogleがChatGPTのライバル「Bard」の一般公開を開始、実際に質問するとどんな答えが返ってくるのか? - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


そして2023年5月の新製品発表イベント「Google I/O」で、Googleは大規模言語モデルのPaLM 2を発表しました。このPaLM 2はコンピューティング最適化スケーリング、データセットの改良、高度な推論タスクに優れたモデルアーキテクチャが組み合わされているとのことで、これまで開発していた大規模言語モデルから精度を大きく向上させたとGoogleは述べています。
Googleが大規模言語モデル「PaLM 2」を発表、すでに25のGoogleサービスに導入済み - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


BardとPaLM 2は、Googleのさまざまな製品や機能に統合されています。その中でも最も大きな成果といえるのが、Googleの検索エンジンに大規模言語モデルを組み込むことで、会話型の検索を可能にした「Search Generative Experience」です。Search Generative Experienceは検索だけでなく、画像やテキストの生成など、コンテンツを作り出すことも可能としています。
Google検索バーからAI画像を生成できる「Search Generative Experience」が登場 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


2023年6月にはテキストから音楽を作成できる「AudioPaLM」が発表されました。このAudioPaLMは、PaLM 2と音声ベースの言語モデルであるAudioLMを統合したマルチモーダルアーキテクチャです。
Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


また、「DuetAI」は、Google WorkspaceとGoogle Cloudでユーザーの書き込みや画像の作成、スプレッドシートの分析、コーディングサポートなどを行うAIで、2023年8月にプレビュー版がGoogle Cloudに導入されました。
Googleがコーディング補助やデータ解析が可能なAIサービス群「Duet AI」のプレビュー版をGoogle Cloudに導入 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


そして、2023年6月には画像生成モデルのImagenを自然言語で対話的に画像を生成・編集できるモデル「Imagen Editor」がリリースされています。Googleの画像生成AI「Imagen」がどういうものかについては以下の記事を読むとわかります。
突飛なテキストからも高精度な画像を自動生成できるAIシステム「Imagen」 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


2023年11月には、YouTubeと提携してAI音楽生成モデル「Lyria」が発表されました。このLyriaは将来的にYouTubeで音楽を自動生成するシステムに組み込まれることが想定されています。
Google DeepMindが音楽生成に特化したAIモデル「Lyria」を発表、口ずさむだけでメロディーが生成される - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


そして、2023年12月にGoogleが発表したマルチモーダルAIモデルが「Gemini」です。Geminiにはパラメーター数に応じてUltra・Pro・Nanoという3モデルが用意されており、最も小さいモデルであるNanoはPixel 8 Proでローカルに動作するAIとして搭載される予定です。
文字・音声・画像を同時に処理して人間以上に自然なやりとりができるGPT-4を超える性能のマルチモーダルAI「Gemini」がリリースされる - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


さらに、Gemini ProによってBardが大幅強化され、2024年にはGemini Ultra搭載の「Bard Advanced」も登場することが予告されました。
AIモデル「Gemini Pro」で大幅強化されたBardが利用可能に、2024年にはGemini Ultra搭載の「Bard Advanced」も登場 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


加えて、2022年に発表された「AlphaCode」にGeminiを組み合わせたプログラミングAI「AlphaCode 2」も発表されています。このAlphaCode 2は前世代モデルであるAlphaCodeと比べて1.7倍の問題解決能力を持ち、競技プログラミングでは参加者の85%よりも優れたパフォーマンスを示したとのこと。
GoogleのマルチモーダルAI「Gemini」ベースのプログラミングに特化したAI「AlphaCode 2」登場、競技プログラミング上位15%に入る性能 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


これらの大規模言語モデルの基幹技術となっているTransformerは、Googleの研究者が2017年に開発したアーキテクチャで、文章をトークンと呼ばれる単位に分解し、確率的にトークンをつなげることでテキストを生成する仕組みです。
ChatGPTにも使われる機械学習モデル「Transformer」が自然な文章を生成する仕組みとは? - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


しかし、Transformerをベースとした大規模言語モデルは自然な文章を作ることこそ得意ではあるものの、算数の問題を解いたり論理問題を考えたりする推論能力は高くなく、小学生レベルの算数の問題ですら間違うことがよくあります。そこで、Googleは「インコンテキスト学習によるアルゴリズム推論」という手法で大規模言語モデルでも算数の問題を解決できるような推論能力を得る研究を進めています。このアプローチによって、中学校レベルの数学テストによるベンチマークの精度が25.9%から61.1%に向上したそうです。
さらに、Geminiのようにテキスト・画像・映像を認識できるマルチモーダルモデルの一環として、カメラで捉えた映像とテキストによる指示を理解できる言語モデル「PaLM-E」を開発したことを明らかにしています。
Googleが視覚とテキストから人間のように理解するロボット向け言語モデル「PaLM-E」を発表、「お菓子を持ってこい」などの複雑な命令も遂行可能 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


2023年7月には、Google DeepMindが映像やテキストを行動に変換できる学習モデル「Robotic Transformer 2(RT-2)」を発表しました。
Googleが学習していない環境でも「○○を動かして」などの複雑な指示を実行できるロボットAI「RT-2」を発表 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


さらに、Google DeepMindは2023年6月に、深層強化学習を利用してさまざまなコンピューティングアルゴリズムを改善するAI「AlphaDev」を発表しています。
DeepMindが深層強化学習を利用してアルゴリズムを改善するAI「AlphaDev」を発表、すでにソートアルゴリズムやハッシュ関数の高速化に成功 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


自然科学の分野では、Google DeepMindが開発したAlphaFoldはタンパク質の立体構造を正確に予測するAIとして研究が進められています。AlphaFoldは記事作成時点で60機関の科学者119人と協力して、ヒトゲノムの新しいゲノムマップを作成することに成功しました。
タンパク質の立体構造を正確に予測するAI「AlphaFold」の最新版がリリース、従来よりも高精度な分子の予測が可能に - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


さらに、2023年9月には遺伝子変異の有害性を予測して遺伝性疾患の原因を特定するのに役立つAI「AlphaMissense」も発表されました。
Google DeepMindがAI「AlphaMissense」を発表、どの遺伝子変異が有害かを予測して遺伝性疾患の原因を特定するのに役立つ可能性 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


Googleは、2023年11月に24時間先まで2分ごとに気象予測が可能なニューラル気象予測モデル「MetNet-3」について詳細を公開しました。さらに、Google DeepMindが発表した気象予測AI「GraphCast」は、10日間の天気を1分で予測できるモデルです。
わずか1分で10日間の天気を予測可能なAI「GraphCast」をGoogle DeepMindが発表、スパコンで数時間かけた予測より高精度 - GIGAZINE

GoogleやGoogle DeepMindが2023年のAIとコンピューティングについての研究成果を振り返る - 画像


Google ResearchやGoogle DeepMindは「マルチモーダルモデルの能力が高まるにつれて、人々は科学から教育、まったく新しい知識分野に至るまで、驚くべき進歩を遂げることができるようになります。技術の進歩は日進月歩であり、Googleの製品や研究も進歩するにつれて、AIはより多くの興味深い創造的な用途に用いられるようになるでしょう。大胆かつ責任を持って追求すれば、AIはあらゆる場所の人々の生活を変える基盤技術になり得ると私たちは信じています。これが私たちをわくわくさせるものなのです」と述べました。

ジャンルで探す