AI学習にYouTubeの字幕を使用したとの報道にAppleが「Apple Intelligence」を含む製品版AIには使っていないと反論
非営利の研究団体が作成したAI学習用のデータセット「The Pile」にYouTubeの字幕が含まれていたことを受け、このデータセットを使用したとされるAppleやNVIDIAが非難されました。これに対し、Appleは「研究用の言語モデルに使用したが、AppleのAI機能であるApple Intelligenceには使用していない」と反論しました。
Apple says its OpenELM model doesn't power Apple Intelligence amid YouTube controversy - 9to5Mac
https://9to5mac.com/2024/07/17/apple-intelligence-openelm-training-youtube/
2024年7月16日にIT系メディアのProof Newsが報じたところによると、非営利AI研究団体のEleutherAIが作成したデータセット「The Pile」に、欧州議会の資料や英語版Wikipediaの文章、17万本を超えるYouTube動画の字幕などが含まれていたとのこと。Proof Newsは研究論文や公開情報を調査して、AppleやNVIDIA、Bloomberg、AI開発企業のAnthropicなどが「The Pile」を使用していたと指摘しました。
Apple・NVIDIA・AnthropicなどがYouTubeの動画字幕を許可なくAIのトレーニングに利用していたと判明 - GIGAZINE
特にAppleは「Apple Intelligence」というAI機能を発表したばかりだったため、不適切なデータを取り入れたのではないかと疑われましたが、後にAppleが「当該データセットは研究用の言語モデルにのみ使用し、Apple Intelligenceを含むAIのいずれにも影響は与えなかった」と反論しました。
Appleは研究用の大規模言語モデルである「OpenELM」を構築しており、その(PDFファイル)研究論文の中で「The Pileを使用した」と明記しています。これについてAppleは「研究コミュニティに貢献し、オープンソースの大規模言語モデル開発を促進することを目的としてOpenELMモデルを作成しており、Apple Intelligenceのためではない」と説明し、該当データセットについてはあくまで研究目的で使用したものであり、Apple Intelligenceには使用していないと強調しました。また、AppleはOpenELMモデルの新バージョンを構築する予定はないとも伝えています。
07/18 11:55
GIGAZINE