要約:

  • Reddit、Slack、Google、Facebook、Instagramなどの企業は、私たちのデータを直接または間接的に使用して、次世代のAI言語モデルを訓練している。
  • 現在のAI世代は、巨大なデータセットで訓練され、人間の言語を認識し、理解し、生成するLLM(large language models)に基づいている。
  • LLMsはパラメータ、ウェイト、トークンの3つの主要部分で構成されており、データの蓄積量が非常に多い。
  • 多くの企業がユーザーデータを悪用しており、ユーザーはデータの製品であるにも関わらず、報酬を受けていない。

考察:

企業がユーザーデータを利用してAIを訓練することは、ユーザーには報酬がないままで行われており、個人データを使用することをやめるべきだという記事の主張は重要だと考えます。私たちのデータが企業の利益のために悪用される現状に対し、ユーザーへの補償方法を見つける必要があると感じます。ユーザーの知識が多国籍企業に利益をもたらしているのであれば、その対価を支払うべきであり、現在の状況を継続すれば、我々が消費する無料コンテンツ/データを作る唯一の存在は、私たちのデータを窃取した企業だけになってしまうでしょう。


元記事: https://www.androidpolice.com/stop-using-our-personal-data-to-train-ai/