- 大規模言語モデル(LLMs)は、自然言語の指示に従うことで幅広いタスクを実行できる
- LLMsのパフォーマンスは指示の品質に大きく左右されるが、効果的な指示を手動で書くのは困難
- Auto-Instructは、LLMsに提供される指示の品質を自動的に向上させるための新しい手法
- Auto-Instructは、LLMsの生成能力を活用して候補の指示を生成し、575の既存NLPタスクでトレーニングされたスコアリングモデルによってそれらをランク付けする
- 118のドメイン外タスクでの実験において、Auto-Instructは人手で書かれた指示と既存のLLM生成指示の両方を上回る
- また、Auto-Instructはトレーニングプロセスに組み込まれていない他のLLMsでも顕著な汎用性を示す
Auto-Instructは、LLMsによって生成された指示の品質を向上させる方法として画期的であり、既存の手法を凌駕していることが示されています。特に、他のLLMsに対しても高い汎用性を示す点は注目に値します。