ニューヨーク・タイムズが「私たちがChatGPTをハッキングしたのではなくChatGPTがペイウォールをバイパスしたのだ」と反論


アメリカの日刊紙であるニューヨーク・タイムズは2023年12月に、ChatGPTが自社の記事をコピーしてほとんどそのまま出力したとして、OpenAIを著作権侵害で提訴しました。OpenAIは、「ニューヨーク・タイムズは意図的に不具合を引き起こしてChatGPTが記事をコピーしているように見せている」と反論していましたが、これに対してニューヨーク・タイムズが「不具合を起こさせたのではなく、ChatGPTが有料記事を盗用した証拠である」と再反論しました。
NYT to OpenAI: No hacking here, just ChatGPT bypassing paywalls | Ars Technica
https://arstechnica.com/tech-policy/2024/03/nyt-disputes-openai-hacking-claim-by-pointing-to-chatgpt-bypassing-paywalls/
ChatGPTが著作権で保護されたコンテンツでトレーニングされ、しばしばその一部を出力する問題をめぐり、多くのニュースメディアや作家がOpenAIを訴えていますが、その筆頭とされているのがニューヨーク・タイムズです。
AIがジャーナリズムを脅かしていると厳しく指弾するニューヨーク・タイムズに対し、OpenAIは「ニューヨーク・タイムズがChatGPTによる盗作の証拠として提出した資料は、トレーニングデータの逆流や幻覚などの不具合を意図的に起こさせて得たもの」として、裁判所に訴訟の却下を求めていました。
OpenAI対ニューヨーク・タイムズ裁判でOpenAIが「ニューヨーク・タイムズは自社の記事を引き出すためにChatGPTをハッキングした」と主張 - GIGAZINE


ニューヨーク・タイムズは新しく裁判に提出した(PDFファイル)文書で、ChatGPTに自社の記事を出力させた方法は適切であると擁護した上で、ChatGPTユーザーは有料記事へのアクセス制限をすり抜けるために、ChatGPTに記事全体を生成させていると指摘しました。
ニューヨーク・タイムズは、ChatGPTが記事をコピーしているかを確認するため、「記事の最初の数単語や文をプロンプトとして用いることで、GPT-4から学習内容を引き出した」と、裁判文書には記載されています。
また、OpenAIは「ChatGPTのユーザーは、有料記事からテキストを生成させるような使い方はしていない」と主張しようとしていましたが、ニューヨーク・タイムズは「ペイウォールをバイパスするためのChatGPTの使用法は広く報じられている」と反論しました。


ニューヨーク・タイムズによると、以前のChatGPTによる著作権侵害は、トレーニングの際にコピーされた記事を表示させる方法によってのみ行われていたとのこと。しかし、2023年5月に「Browse By Bing」というプラグインがChatGPTに導入されると、ChatGPTは基礎モデルの学習データセットに含まれていたもの以上のコンテンツを取得できるようになった上に、ユーザーの検索クエリに応じて記事の内容を検索結果として表示するという著作権侵害を行うようになったと、ニューヨーク・タイムズは主張しています。
この新機能により、ChatGPTユーザーはお金を払わずに有料記事を読めるようになったため、OpenAIは2023年7月に「Browse By Bing」を一時的に無効にしました。
OpenAIはヘルプページで「Browseのベータ版では、望ましくない方法でコンテンツが表示される場合があることがわかりました。例えば、ユーザーがURLを示してその内容を要求したりすると、誤ってその要求に応えてしまう可能性があります。この問題が修正されるまで、Browseを一時的に無効にします」と説明しています。
掲示板型ソーシャルニュースサイト・Redditに、あるChatGPTユーザーは「ChatGPTを使用してペイウォールをバイパスできるようです」と書き込みました。
It looks like you can use ChatGPT to bypass paywalls
byu/HOLUPREDICTIONS inChatGPT
おそらく、OpenAIにとって最も都合が悪いのは、OpenAIが「Browse By Bing」を導入する直前の2023年4月に、ニューヨーク・タイムズがOpenAIにChatGPTが著作権を侵害していることを通告するために連絡を取っている点だと、IT系ニュースサイトのArs Technicaは指摘しています。
というのも、音楽の共有を目的としたファイル共有サービス・Napsterにまつわる裁判では「コンピューターシステムのオペレーターが、そのシステム上で利用可能な著作権の侵害物の存在を知りながら、それをシステムから消去しなかった場合、オペレーターは直接侵害を関知していたのであり、直接的に侵害に加担している」との判例が出ているからです。
ニューヨーク・タイムズはこの判例を引用して、「私たちはChatGPTが私たちの記事を侵害した出力結果を生成していることをOpenAIに知らせました」と述べました。
OpenAIは、3人の作家が起こした別の著作権侵害訴訟でほぼ全面的に勝利しており、これを足がかりにして後続の裁判を有利に進めようとしています。OpenAIは、ニューヨーク・タイムズの訴訟について、「2024年2月に却下された作家らの主張と同一の内容を含んでいる」と主張していますが、ニューヨーク・タイムズは、作家らの訴訟とは実質的に異なるとの見解を示しています。
ChatGPTに対する著作権侵害訴訟の前半戦でOpenAIがほぼ全面勝利、作家3人の訴えの大半が却下される - GIGAZINE


OpenAIはまた、2024年1月に「著作権で保護されたコンテンツなしで有用なAIモデルを構築することは不可能」だとして、記事の使用はフェアユースであると主張しており、Ars Technicaは「もしこの裁判でニューヨーク・タイムズが勝ったら、OpenAIはChatGPTを削除してすべてをやり直すことを余儀なくされるかもしれません」と述べました。

ジャンルで探す