• 2024年11月、Ai2はTülu 3をリリースし、GPT-4などと競合していた。
  • Tülu 3 405Bは、オープンソースの大規模言語モデルで、前回のTülu 3リリースの革新的なトレーニング手法を更に発展させている。
  • 405Bモデルは、強化学習から検証可能な報酬を利用するRLVRシステムを導入し、安全性と複雑な推論タスクの精度を向上させた。
  • RLVRシステムは、大規模なモデルで特に優れた結果を示し、安全性評価でも優れた成績を収めている。
  • Tülu 3 405Bは、GPT-4oと競争力があり、特に安全性のベンチマークにおいてDeepSeek v3を上回っている。

自然言語処理の分野において、Ai2のTülu 3 405Bは革新的なモデルであり、競合他社に対して優位性を示している。特に、強化学習から検証可能な報酬を取り入れたRLVRシステムは、大規模なモデルで高い効果を発揮しており、安全性と精度の向上に成功している点が注目される。

元記事: https://venturebeat.com/ai/ai2-releases-tulu-3-a-fully-open-source-model-that-bests-deepseek-v3-gpt-4o-with-novel-post-training-approach/