生成AIブームの中でアップルが出した「答え」

基調講演のパブリックビューイング会場にて、招待メディアに挨拶するアップルのティム・クックCEO(筆者撮影)

生成AIの時代においてアップルは、新たなテクノロジーイノベーションの波に乗り遅れたーー。そうした声は、OpenAIとマイクロソフト、それにグーグルが生成AIの覇権を争う中で少しずつ強まっていた。

この見方はアップル自身が「われわれはこれまで(AIという言葉は使ってこなかったが)デバイス内のAI処理においてリーダーシップを発揮してきた」とするステートメントを披露するたびに、その意図とは逆に“王者の焦り”のように捉えられる側面もあった。

ライバルを追い抜くための「立ち位置」を確保

しかしアップルが開発者向け会議「WWDC 2024」で披露したAI機能「Apple Intelligence」は、そうした声を払拭するだけではなく、生成AIの時代で先端を走っている企業に追いつき、ある側面では追い抜くための立ち位置を確保したように見える。

Apple Intelligence、略してAIというわけだ。(筆者撮影)

少なくともクラウドへの依存度が極めて高く(消費者向け/企業向け問わず)、個人向けに高性能なAIモデルをフリーミアムで提供できない企業に対しては強みを見せた。大規模言語モデル「Gemini 1.5」の性能が評判のグーグルだが、アップルの展開を受け、事業モデルに関して根本的な練り直しが必要になるかもしれない。

アップルは、同社が持っている独自性と強み(GAFAMなどと呼ばれる中で唯一、高級ハードウェアを事業の中心に据えていること)を活かし、ライバルが追従することが難しいパーソナルな情報を扱う端末の中に、プライバシーを保証する生成AIシステムを統合した。そうすることで、AIトレンドを同社の新しい強みとして組み込もうとしている。

つまり、「弱み」だと見られていた生成AIトレンドを、自らの「強み」に変換したのだ。

Apple Intelligenceはアップル製デバイスで利用できるAI機能で、AIアシスタントとして呼び出せるだけではなく、各デバイスで動作するアプリの中からも利用可能だ。

その中には、MicrosoftのAI機能、Copilotのような使い方もできる。例えば、文章の清書をしてくれたり、文章のトーンを変更したり、あるいは目的に応じて定型の文章を生成するといったことも可能だ。もちろん、各種言語を翻訳したり、長い文章を要約するといったこともできる。

このような機能は、ChatGPTのような質問を入力しての単独アプリケーションとしての使い方だけではなく、デバイス上で動くアプリケーションの1つの機能として利用することができる。

例えばメールアプリケーションの中で、相手に伝えたい文章を粗くてもいいので書き込んでおき、その清書を依頼すると、エレガントなビジネスメールとして通用する文章に仕上げてくれたりする。いくつかの候補が出てくるので、その候補から選んだり、あるいは文体のトーンを変更することも可能だ。

メールの文書作成や書き直し、校正、要約などをAIが行う。あらゆるアプリケーションでこの機能を利用可能(写真:アップル)

メールの場合、冒頭の何行かがプレビューとして表示されることが一般的だ。しかし、必ずしもメールの冒頭部分に核心となる内容が書かれているわけではない。

Apple Intelligence に対応する新しいメールアプリでは、メッセージの内容を把握したうえで、要約をプレビューとして表示するようになっている。これによって実際にメールを開く前に、その内容が優先順位として高いのかどうかを自分自身で判断することが可能だ。

現時点のデモンストレーションでは、アップル純正アプリからの利用方法しか提示されていないが、APIで提供されているため、さまざまなアプリがこの機能を利用し、今後より賢く使えるようになっていく。

ただし、お伝えした機能はApple Intelligenceのごく出発地点でしかない。OS全体がAI対応となり、より賢い機能を実現できる。それがSiriの進化にも見られる。

「Siri」が遂げた大幅な進化

これまでのSiriは、言葉の文脈をたどることが苦手だった。しかし、新しいSiriはApple Intelligenceを用いることで、その弱点を克服している。

具体的には、アップルのデバイス上で動作するさまざまなアプリケーションが取り扱う情報を組み合わせ、複合的に判断し、最終的に答えを生み出す仕組みになっている。例えば、次のようなことだ。

「娘の演劇を観に行くには何時に出発する必要があるか?」という質問に答えるためには、娘が誰なのかを特定し、そのうえで娘とのやりとりの中から予定を決めるためのやりとりを探し、さらに道順を検索しなければならない。

スケジュールはもちろん、移動手段や交通状況などの推測や検索が必要だが、一般的なチャットサービスではこれらを行うことは不可能に近い。

しかし、新しいSiriならば、 やりとりの中からあなたの娘が誰であるかを把握し、娘とのやりとりを識別しながら、その内容について把握して、最終的に必要な情報を引き出すまでの一連の作業を行ってくれる。

しかも、情報を探す手段は必ずしもメールだけではない。

メールを探しても、特定のやりとりを見つけられなかったという経験は、誰しもがあるはずだ。どこかのSNSで会話をしたのか、あるいはSMSでそのやりとりを行ったのか、本人はメールだと思い込んでいるだけで、ほかの方法で連絡を取っていた可能性もある。そのような場合でも、新しいSiriは該当する情報を複数の場所から見つけ、連絡を取り合った内容について把握することができる。

アプリをまたいであらゆる個人情報を参照し、最適なサジェストをするようになったSiri(写真:アップル)

こうした機能を実現するためには、デバイス上にあらゆる情報が入ってこなければ行うことができない。例えば、Google Workspaceを使っていた場合、グーグルは他社のツールでローカル処理している情報までは探すことはできない。

一連の機能は、今年後半(おそらく9月以降に提供される各OSの定期アップデート)で北米市場で英語対応のみで導入され、来年以降に各国言語へと対応幅を広げていく。利用可能なデバイスはiPhone(15 Pro以降)およびApple M1を搭載したiPadおよびMacだ。

「Apple Intelligence」に4つの特徴

Apple IntelligenceとほかのAIソリューションの違いは大きく分けると4つある。

1つ目は前述したように、端末に集まる情報を活用した利便性を提供できること。iPhone、iPad、Macという3種類のパーソナルコンピューティングデバイスで扱っている情報を、デバイス内でフルに活用できるということだ。これらのデバイス、特にiPhoneに集まるユーザーにとって最も身近な情報を基にしたAI機能を実現できる。

Apple IntelligenceはアップルのOSに統合されているため、その上で動作するあらゆるアプリケーションと連動する。そして、それらのアプリケーションで扱う情報をApple Intelligenceの中で分析できる。複数のアプリケーションをまたいで連携し、複雑な機能や情報抽出を実現できるのは、Apple Intelligenceがあなたのことをよく知っているからである。

2つ目は“プライベートクラウド”とアップルが呼ぶ、新たな仕組みを用いることで、デバイス内のエッジAIとクラウドの大きなパフォーマンスを用いたAIをシームレスに統合していることだ。

アップルのAIソリューションは、基本的にはデバイス内で完結するエッジAIで処理される。デバイス内で処理される言語モデルのパラメーター数は30億。この規模はクラウド上で提供されるLLMに比べれば1桁少ないが、デバイス上で処理される質問に絞り込んでおり、個人的なタスクの多くはこなせる。

ちなみにマイクロソフトがCopilot+ PCに搭載するデバイス処理用の小規模言語モデル(SML)「Phi-Silica」は33億パラメーターだが、アップルはその原型となっている38億パラメーターのPhi-3-miniよりも文章生成において良い成績を挙げているという。

これだけでも、自社の持つ強みをうまく使っているが、4つあると書いた残りの2つもライバルが追従しにくい要素だ。

クラウドAIレベルのサービスを無料で提供

3つ目の違いは、クラウドに接続しながらもプライバシーを守るというiPhoneの理念と同じアプローチが言語モデルの中でも徹底されていることにある。 プライベートクラウドという技術を用いると、ユーザーはそれと意識する必要なく、デバイス内でのAI処理で不足する内容の処理を、アップルが設置するデータセンター内で動作するAIプロセッサーで実行させる。いわゆるクラウドAIである。

デバイス内の処理とプライベートクラウドへの拡張はシームレスに行われ、ユーザーはいっさいそこに関与する必要はない。プライバシーデータはクラウドで処理を行ったとしても漏れることがないように設計されている。

データセンター内で実行される大規模言語モデルのパラメーター数は発表されていないが、その性能はGPT-3.5-Turboなどと遜色ない性能を、より高いエネルギー効率で実現しているという。

では、どのようにしてプライベートクラウドを機能させるのだろうか?

プライベートクラウドの詳細は極めて複雑だが、ここでは可能な限りシンプルに説明することにしよう。

クラウドでの処理が必要な場合でも、デバイス上のAIによって送信する情報を細分化して送り、その結果をデバイス内で再構築する。例えば「娘の演劇を観に行くには何時に出発する必要があるか?」という前出の質問では、必要なスケジュール情報や位置情報を送信するが、その前に匿名化され、IPアドレスもたどれなくなる。

最後4つ目の違いは、サーバーを用いたクラウドAI規模のサービスを無料で提供できることだ。米ビッグテックの中で唯一、本業がハードウェア販売にあることも一因だが、自社開発のAIプロセッサーで構成するクラウドを運用するデータセンターが省電力設計で、それを100パーセント再生可能エネルギーで賄っている。デバイスとAI処理を分業することで負荷も下げることができ、結果として自社ハードウェアに内蔵する無料の機能として一体化できた。

ほとんどの機能をクラウドに依存し、無料モデルが中心のGoogleは論外としても、マイクロソフトのようにOffice 365という大きなの収益をもたらす製品を持つ企業でも、大規模なパラメーターのAIモデルを無料で組み込むことはできない。それゆえ、それを継続的にデバイスに付与する機能として使い続けられるというのは、大きなアドバンテージになりうるだろう。

“生成AIイノベーション”で独自の立ち位置に

もっとも誤解してはならないのは、生成AIにおいてアップルがライバルに「宣戦布告」をしたわけではないということだ。彼らが開発しているのは、すべて最終製品であるiPhone、iPad、Macの機能を高め、使いやすくするためのものだからだ。

Apple Intellogenceを説明する同社ソフトウェアエンジニアリング担当シニアバイスプレジデント、クレイグ・フェデリギ氏(著者撮影)

例えば新しいSiriでは、リクエストされた処理を行うためにオープンAIのChatGPTを用いたほうがいいと判断した場合、ユーザーに同意を求めたうえでChatGPTに質問を送信する。ユーザーは自身のデータがChatGPTに送信されることを納得したうえで利用でき、また有料サービスに契約している場合は、最新モデルのGPT-4oも利用できる。

また、特定の医療知識、特定の国の法律に基づいた文書作成や手続き、規制などに特化して学習したモデルなど、カスタムAIモデルや今後登場する未知のAIモデルに対応できるよう設計されている。したがって、グーグルのAIモデルもいずれは利用可能になると予想される。それらは競合するものではなく、アップル提供の端末所有者を支援するための極めてパーソナルなAIだからだ。

例年以上に大きな注目を集めた「WWDC 2024」。そこでアップルが明確にしたのは、将来的に他社が提供するAIサービスと同社デバイスが連携することがあったとしても、競合することはないという立ち位置だった。

(本田 雅一 : ITジャーナリスト)

ジャンルで探す