• 学術出版社が研究論文へのアクセスを売却
  • AIモデルの訓練に使用され、著者の同意なしに行われることに研究者から懸念の声
  • 研究論文が爆発的に増加するAIチャットボットの訓練に使用されることに疑問
  • 大規模言語モデル(LLM)に基づくAIモデルは巨大なデータ量を使用し、テキストを生成する
  • 科学的情報の大規模なデータセットでモデルを訓練することで、科学トピックについての理解能力向上

考察: AIモデルの訓練に使用されるデータの購入トレンドが拡大しており、出版社はそれを無断で使用されるよりも合意の下で提供する方が望ましいと考えている。LLMの特定の論文の使用を証明することは困難であり、これに対する解決策として法的手続きが行われている。研究者たちは公開されている論文に対するクレジットの配分や使用有無を知る手段の確立が求められている。

元記事: https://www.nature.com/articles/d41586-024-02599-9