ChatGPTに「人間並み」の音声会話機能 50以上の言語で

米オープンAIの開発者会議で話すサム・アルトマン最高経営責任者(CEO)=2023年11月、五十嵐大介撮影

 米オープンAIは24日、対話型AI「ChatGPT(チャットGPT)」上で音声でのやりとりができる機能「アドバンストボイス」を有料利用者向けに提供すると発表した。日本語や中国語など50以上の言語で使えるようになる。

 新たな機能は、同社が5月に発表したAIの言語モデル「GPT―4o(フォー・オー)」を活用。チャットGPT上で音声で質問すると、人と会話するようにリアルタイムで回答する。回答速度は約0.3秒で人間並みの速さだとしている。

 24日に公開したデモでは、利用者が祖母に遅刻をしたことを謝りたいと話しかけると、「こんなに遅くなってごめんなさい」と英語で回答。「祖母は中国語しか話さない」と伝えると、中国語で回答した。会話の途中で話しかけても回答をした。

 オープンAIは5月にこの音声機能を公表した際、俳優のスカーレット・ヨハンソンさんが自身の声に似ているとして同社を批判し、問題となった音声の提供を停止した経緯がある。同社は今回、新たに5種類の音声を導入した。(サンフランシスコ=五十嵐大介)

ジャンルで探す