OpenAI:「著作権のある素材を使わずに今日の主要なAIモデルを訓練することは不可能」

Table of Contents

OpenAI:「著作権のある素材を使わずに今日の主要なAIモデルを訓練することは不可能」

AI専門家で評論家のゲイリー・マーカス氏とデジタルイラストレーターのリード・サウザン氏が共同執筆したこの研究では、OpenAIとDALL-E 3が映画のワンシーン、有名俳優の写真、ビデオゲームのコンテンツの実質的に類似したバージョンをレンダリングする「盗作出力」の複数の例が記録されている。

ユーザーは、画像を作成するときに、著作権を侵害しているかどうかわからない場合があります。

どちらの企業も、AI モデルの作成に使用したトレーニング データを完全には公開していません。

AI企業に異議を唱えているのはデジタルアーティストだけではない。ニューヨーク・タイムズ紙は最近、OpenAIのChatGPTテキストモデルが同紙の有料記事をほぼそのままコピーしてしまうとして、OpenAIを提訴した。書籍著者やソフトウェア開発者も同様の訴訟を起こしている。

先行研究では、OpenAIのChatGPTは訓練テキストを再現できることが示唆されている。また、MicrosoftとGitHubを訴えている人々は、Copilotコーディングアシスタントモデルはコードをほぼ逐語的に再現すると主張している。

OpenAIもサブスクリプション料金を徴収しており、同様に利益を得ています。OpenAIとMidjourneyはコメント要請に応じませんでした。

しかし、OpenAIは月曜日にブログ記事を公開し、ニューヨーク・タイムズ紙の訴訟について反論した。AI販売業者は訴訟に根拠がないと主張した。驚くべきことに、OpenAIは、自社のニューラルネットワークが著作権侵害コンテンツを生成する場合、それは「バグ」だと主張した。

法律が決める

オチョア氏はこの結論に疑問を呈し、報告書の著者らが入力した「プロンプトは、彼らが実際に盗作の出力を直接的に求めていることを示している。すべてのプロンプトは特定の映画のタイトルを言及し、アスペクト比を指定し、1つの例を除いて「映画」と「スクリーンショット」または「スクリーンキャプチャ」という言葉が含まれている(唯一の例外は、彼らが複製しようとした画像について説明している)」と主張した。

脳

人工知能は負債である

必読

オチョア氏は、生成AIモデルは、トレーニングデータセット内に特定の画像のインスタンスが複数存在する場合、その画像を再現する可能性が高くなると述べた。

「今回のケースでは、訓練データに映画全体が含まれていた可能性は極めて低い。むしろ、映画の宣伝用静止画として配布された映画の静止画が含まれていた可能性が高い」と彼は述べた。「これらの画像は、メディアが宣伝目的で配布するよう奨励され、実際に配布したため、訓練データ内で複数回複製されたのだ。」

オチョア氏は、AIモデルによるこうした行動を制限するための措置は既に存在すると述べた。「問題は、プロンプトを入力した人がAIに認識可能な画像を再現させたいと明確に思っていたこと、そして元の静止画を制作した映画スタジオがそれらの静止画を広く配布したいと明確に思っていたことを考えると、AIモデルにそのような措置を取らせる必要があるのか​​どうかだ」とオチョア氏は述べた。

「より良い質問はこうでしょう。プロンプトが特定の映画について言及していなかったり、特定のキャラクターやシーンを説明していなかったりする場合、これはどのくらいの頻度で起こるのでしょうか? 偏見のない研究者なら、答えはおそらく「めったにない(おそらくほとんどない)」と答えるでしょう。」

OpenAIが貴族院に反論

「トレーニングデータを1世紀以上前に作成されたパブリックドメインの書籍や図面に限定すると、興味深い実験になるかもしれないが、今日の市民のニーズを満たすAIシステムは提供されないだろう。」

  • ミッドジャーニーのAIが盗作しているアーティスト数千人のリストがこちらだとクリエイターたちは主張している
  • テキストや写真でAIを訴える声は多い。でも音楽はどうだろう?まだ何も見ていないようだ。
  • AI著作権争いの真の目的は、人間の労働力と終わりのない機械の争いである。
  • ニューヨーク・タイムズ、ChatGPTの訓練に使用された「数百万件の記事」をめぐりOpenAIとマイクロソフトを提訴

IEEEレポートの共著者であるマーカス氏は、OpenAIが現在のビジネス慣行に対して英国で規制の承認を得ようとしている取り組みに懐疑的な見解を示した。

「大まかに訳すと、盗みを許さなければ私たちは大金持ちにはなれません。だから、盗みを犯罪にしないでください!」と彼はソーシャルメディアに書き込んだ。「ライセンス料も払わせないでください!Netflixは年間数十億ドルものライセンス料を払っているかもしれませんが、私たちが払う必要はないはずです!もっともっと、私たちにお金をください!」

Midjourney は反対のアプローチを取り、侵害に関与した顧客を追跡して訴訟を起こし、関連する請求から生じる訴訟費用を回収することを約束しました。

「他者の知的財産権を故意に侵害し、それによって当社に損害が発生した場合、当社はお客様を探し出し、その損害額を回収いたします」とMidjourneyの利用規約には記載されています。「また、裁判所に訴訟費用の支払いを求めるなど、その他の措置を取る場合もあります。そのような行為は絶対にしないでください。」®

Discover More