- AI研究者は大規模なニューラルネットワークを使用して、大量のデータでトレーニングを行ってきた
- AIが2028年頃にトレーニングデータを使い切る可能性がある
- データ所有者がアクセスを制限し、AIのデータ不足が危機を引き起こす可能性がある
- AI企業は新しいデータを生成し、異例のデータソースを見つけるなどの対策を講じている
- AIのトレーニングデータ不足はAIスケーリングの従来戦略に大きな問題をもたらす可能性がある
この記事では、AIのトレーニングデータ不足の問題に焦点が当てられており、AI開発者が新しいデータ生成方法や特化したデータセットを活用するなどの対策を模索していることが示されています。AIのスケーリング戦略に変化が生じつつあり、より効率的で特化したモデルの開発が注目されています。
元記事: https://www.nature.com/articles/d41586-024-03990-2