- 多くの主要な出版社がApple Intelligenceのトレーニングを支援する同社のクローラーボットであるApplebot-Extendedをブロックしていることが報告されている。
- Facebook、Instagram、Craigslist、Tumblr、The New York Times、The Financial Times、The Atlantic、Vox Media、USA Todayネットワーク、WIREDの親会社であるCondé NastなどがAppleのAIトレーニングから自社のデータを除外することを選択している。
- 多くの出版社が、AI企業と商業契約を結ぶまで、クローラーボット(Appleを含む)を自動的にブロックしていることは驚くべきことではない。
- AppleのLLMをトレーニングするために以前に使用されていたものや、今後クローラーをブロックすることがどのような影響を与えるかは未解決の問題となっている。
- ニューヨーク・タイムズの役員は、「法律とタイムズ自身の利用規約に明記されているように、商業目的でのスクレイピングやコンテンツの使用は、事前の書面による許可なしには禁止されている」と述べている。
- 著作権法は、技術的なブロック措置があっても侵害行為は適用され、著作物の盗用はコンテンツ所有者が除外する必要のあるものではない。
この記事から、出版社がデータの利用に関して厳格な姿勢を取っており、AI企業との合意がない限り、クローラーボットをブロックする傾向があることが分かります。ニューヨーク・タイムズのコメントからも、著作権侵害に対する重要性がうかがえます。
元記事: https://sixcolors.com/link/2024/08/whos-blocking-apples-ai-crawler/