要約:
- 人間は、少ない例から学んだことを早く大きな文脈に適用でき、新旧の情報を組み合わせることができる。
- 高次の洞察を抽出し、業績を向上させるために、最近の研究ではビジュアル言語モデル(VLMs)と大規模言語モデル(LLMs)を利用している。
- カーネギーメロン大学とGoogle DeepMindによる新しい研究では、In-Context Abstraction Learning(ICAL)という新しいアプローチがVLMsのトレーニングに使用されている。
- ICALは、VLMsが新しいドメインで多様な抽象化を構築するのを手助けし、多様な状況から経験を理解し学ぶことを可能にする。
- ICALの効果は、TEAChでのエージェントの最先端のパフォーマンスによって示されており、これは先行研究を上回っている。
考察:
ICALのアプローチは、他の抽象化なしでアクションプランや軌跡を使用したインコンテキスト学習よりも常に優れたパフォーマンスを発揮し、細心の注意を払って作成された例の必要性を著しく減らしています。さらなる研究やICAlの潜在的な課題に対するチームの認識が述べられており、成長と改善の機会として捉えられています。