• Mistralが新しい競合製品Mistral Large 2を発表
  • Mistral Large 2はMetaのLlama 3.1より小さく、1230億のパラメータを含む
  • Llama 3.1は4050億のパラメータを持つ最大のモデル
  • Mistral Large 2は競争力のある性能を示す
  • Large 2はCodestral 22BやCodestral Mambaを上回り、Javaにおいて特に優れている
  • Llama 3.1はMultilingual MMLUベンチマークでLarge 2にパラメータ数で勝つ必要がある
  • Mistral Large 2はオープンソースではないが、研究者は利用可能

私の考え:Mistral Large 2は小さなモデルでありながら競争力のある性能を発揮しているという点で興味深い。特に、Javaにおいて優れた結果を示していることが注目される。オープンソースではない点は制限があるが、研究者が利用できることはプロフェッショナルな利用やアプリケーション開発にMistralを活用する組織にとって有益である。

元記事: https://www.techzine.eu/news/analytics/122742/mistral-unveils-large-2-model-large-enough-but-good-enough/