要約:
- 著作権付きのテキストを訓練に使用した大規模言語モデル(LLM)が法的争いと削除通知を引き起こしている。
- 様々なAI技術が進展する中、多くのLLMは著作権付きコンテンツを含むデータセットで訓練されている。
- 権利者が合法的な著作権主張を持つか、またはテクノロジー企業が「公正使用」の防衛を頼りにできるかは裁判所が最終的に決定する。
- AI訓練データセット「Books3」は多数のLLMの訓練に使用され、著作権侵害の苦情が急増。
- 権利者と反海賊団体の圧力により、「GEITje-7B」という大規模なオランダ語LLMが取り下げられた。
- GEITjeの開発者は法的争いには資金が足りないため、自主的にオフラインにした。
- GEITjeの開発者は著作権保護の重要性を強調しつつ、オープンソースのオランダ語AI環境に希望を持っている。
考察:
著作権とAIの関係は今後ますます重要になると考えられます。技術の進歩と法的規制の間にはバランスが求められるでしょう。GEITjeのような事例が今後増える可能性もあり、AI開発者は合法的なコンテンツの使用についてより慎重に考える必要があると感じます。
元記事: https://torrentfreak.com/llm-taken-down-following-legal-pressure-from-anti-piracy-group-250128/