Microsoftとアメリカの出版社「HarperCollins」が「ノンフィクション本でAIモデルをトレーニングする契約」を締結したとの報道
Microsoftが2024年11月に、アメリカの出版社・HarperCollinsとAI学習に関する契約を締結し、AIモデルのトレーニングに一部のノンフィクション本を利用する許可を得たことが報じられました。
Microsoft Signs AI-Learning Deal With News Corp.’s HarperCollins - Bloomberg
https://www.bloomberg.com/news/articles/2024-11-19/microsoft-signs-ai-learning-deal-with-news-corp-s-harpercollins
Microsoft is the mystery AI company licensing HarperCollins books, says Bloomberg - The Verge
https://www.theverge.com/2024/11/19/24300893/microsoft-ai-training-deal-harpercollins-report
HarperCollins to allow tech firms to use its books to train AI models | Publishing | The Guardian
https://www.theguardian.com/books/2024/nov/19/harpercollins-tech-firms-books-train-ai-models-nonfiction-artificial-intelligence
Microsoft Ignite 2024: Embracing the future of Windows at work | Windows Experience Blog
https://blogs.windows.com/windowsexperience/2024/11/19/microsoft-ignite-2024-embracing-the-future-of-windows-at-work/
Microsotをはじめとするテクノロジー企業は、SNSやニュース記事など、さまざまなデータを使用してAIモデルのトレーニングを行っており、プログラムの精度を高め、特定のテーマに関する専門知識を出力するために、ライセンスを取得できる学習元である高品質のテキストを探しています。
HarperCollinsは複数の海外メディアに対し、「匿名のAIテクノロジー企業と、モデルの品質とパフォーマンス向上を目的として、AIモデルのトレーニングに一部のノンフィクション本を限定的に使用することを許可する」ことで合意に達したことを発表しました。また、HarperCollinsは「私たちの役割の一部は、本の著者に対し『AIトレーニングに使用していいか』を検討する機会を提供すると同時に、彼らの作品の根本的な価値と、私たちが共有する収益とロイヤリティの流れを保護することです」「今回の契約は、その限られた範囲と、著者の権利を尊重するモデル出力に関する明確なガードレールを設けたことにより、実現しました」と述べており、書籍をAIのトレーニングに使用するかどうかはその著者に委ねられていることを明らかにしています。
アメリカの児童文学作家であるダニエル・キブルスミス氏は、2024年11月にHarperCollinsから「かつて出版した書籍の1つをAIモデルのトレーニングに使用していいか」と尋ねるメールが届いたことを報告しています。メールの中でHarperCollinsは「3年間のライセンスで1冊あたり2500ドル(約38万7000円)を提供する」「クレジットに関する一定の保護とAIによる回答の生成の際には制限が設けられる」と説明しています。
Abominable.
[image or embed]— Daniel Kibblesmith (@kibblesmith.com) 2024年11月16日 4:36
HarperCollinsは契約を結んだ相手について「相手から会社の身元を秘密にしておくように求められていますが、大手で尊敬される企業であると信じるに足る十分な理由があります」と述べていますが、匿名の関係者は海外メディアのBloombergに対し、この企業がMicrosoftであることと、HarperCollinsの書籍を用いて記事作成時点で発表されていないAIモデルのトレーニングを実施することを伝えています。また、この人物によると、Microsoftは入手したデータを用いてAIに本を作成させる計画はないとのこと。
なお、今回の報道に関してMicrosoftはコメントを拒否しています。
Microsoftは2024年11月18日から開催されている開発者向け会議「Microsoft Ignite 2024」の中で、量子コンピューター開発企業のAtom Computingと共同で、2025年に商用量子コンピューターを発売することを発表しているほか、ビデオ会議ツール「Microsoft Teams」に、リアルタイムで話し手の音声を翻訳するという機能「Interpreter in Teams」が追加される予定であることなどを発表しています。
Microsoft Teamsに自分の声を複製して別言語でしゃべらせる機能が追加される予定 - GIGAZINE
また、MicrosoftはAIアシスタント「Copilot」をはじめとするAIの実行に適したPC「Copilot+ PC」をリリースするなど、近年AIに力を入れており、Microsoft Ignite 2024でも自分専用のオリジナルのCopilotを作成できる「Copilot Studio」に高度なチューニング機能やAzure AIをCopilot Studio内で直接呼び出す機能などを発表しました。
Bring your own knowledge - YouTube
Microsoftによると、Copilot Studioのリリース以来、10万を超える組織がCopilot Studioを通じてAIエージェントを作成または編集しているとのこと。Microsoftのチャールズ・ラマンナ氏は海外メディアのVentureBeatに対し「Copilot Studioの成長は我々の想定よりもはるかに速く、これまでMicrosoftがリリースした他のどの種類の最先端技術よりも成長速度が著しいです。Copilot Studioのユーザー数はわずか4四半期で2倍にまで成長しています」と述べています。
さらに、Microsoftは生成AIの開発ハブであるAzure AI Studioを含む、Azure AIサービスの新たなプラットフォーム「Azure AI Foundry」を発表し、Azure AI Foundryを管理するためのソフトウェア開発キットとして「Azure AI Foundry SDK」を提供することを明らかにしています。
Azure AI Foundry SDKについてMicrosoftは「開発者がGitHubやVisual Studio、Copliot Studioなど、どこでビルドしてもコンポーネントを統合してAIアプリケーションを構築できるようにする、簡素化されたコーディングエクスペリエンスを提供し、アイデア出しからコーディング、クラウドへのアップロードまでの開発過程をサポートします」と語りました。
加えて、ハイパフォーマンスコンピューティング(HPC)アプリケーション向けの仮想マシン「Azure HBv5 Virtual Machines」をMicrosoftは発表しています。Azure HBv5 Virtual Machinesは流体力学の計算や自動車および航空宇宙シミュレーション、気象モデリング、エネルギー研究、分子動力学など、メモリ帯域幅を多く消費するHPCアプリケーション向けに最適化されているとのこと。
Microsoftによると、今回のAzure HBv5 Virtual Machinesは従来製品と比較して最大8倍となる約6.9TB/秒のメモリ帯域幅を実現しており、分析情報を得るまでの時間とコスト効率の両立を実現する上でのボトルネックとなっていた標準的なサーバー設計によるメモリパフォーマンスの問題を解決しているそうです。
また、Microsoftは同社初のデータ処理ユニット「Azure Boost DPU」を発表しました。DPUとは、データトラフィックのセキュリティやネットワークルーティングなど、特定のデータ処理タスクを処理するために設計された専用のハードウェアで、Azure Boost DPUは「高効率で低電力のデータ中心のワークロード」向けに設計されており、Microsoftは「Azure Boost DPUを搭載したAzureサーバーは既存のサーバーの4倍のパフォーマンスでストレージワークロードを実行しつつ、消費電力は3分の1に抑えることが可能」とアピールしています。
Microsoftは「Azure上のスケールアウトやコンポーザブルワークロード向けに設計されたAzure Boost DPUは、クラウドインフラストラクチャのストレージやネットワーキング、アクセラレーションなど、さまざまな分野で高い効率を実現します」と語っています。
さらに、デジタル暗号化署名と、データの暗号化に使用されるビット列を性能や遅延を犠牲とすることなく、安全なモジュールに含めることができるクラウドセキュリティチップ「Azure Integrated Hardware Security Module(Azure Integrated HSM)」を発表しました。Azure Integrated HSMはTPMのように暗号化や署名などに利用するハードウェアキーを内蔵したもので、ソフトウェアベースのキーと比較してデータを盗むことが困難とされています。
Microsoftによると、Azure Integrated HSMは2025年にAzureのハードウェアにインストールされ、機密性が高いアプリケーションや一般的なワークロードに活用できるようになるとのことです。
11/20 19:00
GIGAZINE