• 大規模言語モデル(LLM)はユーザーの入力に応じて言語セットを予測し、AIが自己思考であるかのように見せる
  • 大規模アクションモデル(LAM)は、ユーザーの入力を理解し、対応するアクションを実行可能な人工知能システム
  • LLMがテキストやメディア出力を生成するのに対し、LAMは複雑なアクションを代行して行う能力を追加する
  • LAMは複雑なアクションを行うことができ、例えば、近くのスターバックスからコーヒーを注文したり、Uberから乗車を依頼することが可能
  • LAMは既存のLLMの能力を拡張し、単純なタスクだけでなく高度なタスクも実行可能

私の考え:LAMはLLMよりもさらに興奮をもたらす概念であり、将来のAIの方向性を示すものであると考えられる。ただし、現時点ではまだ準備が整っていない。Rabbitのr1デバイスはLAMを活用する最初の商用製品であったが、そのマーケティング約束を十分に果たすことができなかった。実現前にさらなる作業が必要であり、興奮するのはまだ早いということを念頭に置くべきである。

元記事: https://www.makeuseof.com/what-is-a-large-action-model-lam/