要約:

  • GoogleはGemini 2.0大規模言語モデルAIを利用して、科学的な新しい仮説を生成する能力を人間の研究者のチームよりも短い時間で提供している。
  • AI共同研究者は、科学者の研究目標に基づいて新しい研究仮説や研究概要、実験プロトコルを生成するために設計された。
  • GoogleのAI共同研究者は、複数のエージェントを使用して同時に文献のレビュー、仮説の形成、評価を行う。
  • テスト時のスケーリングは、AIエージェントが増加する計算リソースを使用して出力を反復的に見直し、再構築することを強調している。
  • AI共同研究者は、エリートの比較を通じて生成された複数の仮説を評価し、ランク付けするために「Elo」スコアを使用する。
  • 研究者のデータによると、AI共同研究者の相対的な品質は、計算予算の増加とともに向上し、チェスやスポーツのEloスコアが高くなる。

考察:

GoogleのGemini 2.0 AIは、AI共同研究者を通じて科学的な研究を加速するための革新的な進歩を提供しています。AI共同研究者は、複数のエージェントを駆使して研究仮説の生成や評価を行い、人間の研究者を補完する助手として機能します。テスト時のスケーリングやEloスコアの活用など、AI共同研究者は計算リソースの効率的な活用を示しており、人間の観測者からも高い評価を受けています。


元記事: https://www.zdnet.com/article/googles-ai-co-scientist-is-test-time-scaling-on-steroids-what-that-means-for-research/