要約:

  • OLMo 2はAllen Institute for AIの新しいオープンソース言語モデルで、7Bおよび13Bのパラメータ構成で利用可能。
  • モデルはトレーニングの安定性を再定義し、異なるデータセットを取り入れるなどの改善を行い、新しい基準を設定。
  • OLMo 2の性能は前任のOLMo-0424に比べて向上し、さまざまな評価タスクで優れた結果を示す。
  • モデルの開発にはモデルのソーピングなどの技術が活用され、オープンソース言語モデリングの新たな基準を示す。

感想:

OLMo 2の登場は言語モデリング分野において重要な転機となっており、トレーニングの安定性や評価の透明性といった課題に取り組んでいます。オープンソースAIの新たな基準を設定することで、協力的なイノベーションの可能性を示し、より公正な技術の進歩の道を開いています。


元記事: https://www.infoq.com/news/2024/12/olmo-2-ai2/