- 大規模言語モデル(LLM)はユーザーの入力に応じて言語セットを予測し、AIが自己思考であるかのように見せる
- 大規模アクションモデル(LAM)は、ユーザーの入力を理解し、対応するアクションを実行可能な人工知能システム
- LLMがテキストやメディア出力を生成するのに対し、LAMは複雑なアクションを代行して行う能力を追加する
- LAMは複雑なアクションを行うことができ、例えば、近くのスターバックスからコーヒーを注文したり、Uberから乗車を依頼することが可能
- LAMは既存のLLMの能力を拡張し、単純なタスクだけでなく高度なタスクも実行可能
私の考え:LAMはLLMよりもさらに興奮をもたらす概念であり、将来のAIの方向性を示すものであると考えられる。ただし、現時点ではまだ準備が整っていない。Rabbitのr1デバイスはLAMを活用する最初の商用製品であったが、そのマーケティング約束を十分に果たすことができなかった。実現前にさらなる作業が必要であり、興奮するのはまだ早いということを念頭に置くべきである。
元記事: https://www.makeuseof.com/what-is-a-large-action-model-lam/