Gemini Liveが無料になったよ。スマホと自然な会話ができておもろい
2024年8月のMade by Googleイベントで、Pixel 9のラインナップとともに初めて披露された「Gemini Live」。
これまで有料プランのGemini Advancedユーザーに限定されていましたが、すべてのユーザーが無料で利用できるようになりました。
AIと世間話ができる
音声ベースのAIアシスタントにこだわらないのであれば、マイクロソフトはCopilotを通じてWindows 11で同様の機能を使うことが可能です。これでスパイク・ジョーンズ監督の映画『her/世界でひとつの彼女』のようなやりとりもできますね。
Gemini Liveは電源ボタンを長押しすると、右下にGemini Liveの利用を許可するポップアップが表示。1ページのチュートリアルに同意し、男女や英語の方言など10種類の音声から選択すると、スマホと無意味な会話を楽しむことができるようになります。
Androidなら電源ボタンの長押しでGemini Liveにアクセスでき、長押しすると通常のアシスタントアイコンではなく、青い星のアイコンが表示されます。
例えば、視聴中のYouTube動画について質問することも可能。また、テキストアプリからAIを使って素早く画像を生成することもできます。
このインターフェースを通じて、スマホと「自然に」話すことができるようになります。グーグル・アシスタントの妨げになっていたような聞き取りの失敗やぎこちない言い回し、アクセントを気にする必要がなくなるわけです。
Copilotも大幅アップグレード
一方、マイクロソフトはCopilotが同様の大幅なアップグレードすることを発表しました。この機能はCopilot Visionと呼ばれ、最新のアップデートでは、画面上に表示されているテキストやビデオを認識し、ユーザーがそのコンテンツについてより多くの質問をすることができるようになります。あるいは、マイクロソフトのプロモーションビデオのように、おばあちゃんの写真について、無関心で冷淡なAIチャットボットと非常に気まずい会話をすることも可能です。
それから、Copilot Voice。これまでCopilotとのやり取りはテキストベースでしたが、Copilot Voiceにより音声によるコミュニケーションができるようになりました。音声オプションは4種類。Gemini Liveと同様の機能で、Copilotアプリを通じてスマホからアクセスできます。
Copilotに高級オリーブオイルの購入についてアドバイスを求めることも可能です。産地などどういうもの選ぶのがいいのか、調理用とドレッシングなどそのまま使うのに適したオリーブオイルの違いなどをユーザーは質問していますが、AIの回答は正直、曖昧なものばかり。まあ、それが自然な会話というものなのでしょう。
気になるセキュリティ面は?
実際にこれらのAIを活用するとなれば、セキュリティ上の問題も考慮する必要があります。Gemini Liveは、起動すると自動的にスマホのマイクがオンになります。自動録音を終了するには、「ホールド」または「終了」ボタンを押し続けるか、「停止」を指示すればOK。Googleのプライバシーページによると、Geminiの処理はGemini Appsのアクティビティに保存され、それらの会話は72時間保存されます。
マイクロソフトによると、Copilot Visionはクラウドやコンピュータにデータを保存せず、「セッションを終了した瞬間にデータは永久に破棄される」とのこと。また、限定されたウェブサイトで動作し、ペイウォールの背後に含まれるコンテンツでは動作しません。
「プライバシー的にどうなのか」と非難を浴びたCopilot+のRecall機能。マイクロソフトはおそらくビッグテック(Google、Amazon、Apple、Meta)がAIモデルを開発するために、自分たちのコンテンツを無駄にして損を被ったオンライン・パブリッシャーや、一部の国会議員に対処したくないのだろう。
このグーグルとマイクロソフトによる両機能は、少なくとも今のところは無料で使えます。Copilot Voiceは徐々にユーザーに展開されますが、Copilot Visionは限られたCopilot Labsベータユーザーに限定されるかもしれないとのことです。
10/07 18:00
GIZMODO