• Mistral AIが1230億パラメータの大規模言語モデル「Mistral Large 2(ML2)」を発表
  • ML2はOpenAI、Anthropic、Metaのトップモデルに匹敵
  • ML2には128,000トークンのコンテキストウィンドウや多言語サポートなどの機能が備わる
  • ML2はリソースの一部を使いながら高いパフォーマンスを実現
  • ML2は商用アプリケーションに非常に適したモデルで、16ビットの精度で約246GBのメモリを必要とする
  • ML2はより高いスループットを実現し、メモリ帯域幅によってLLMパフォーマンスが大きく影響される
  • ML2はモデルの生成が要求に応じて高速であるため、小規模モデルの方がクエリに迅速に応じる
  • ML2は「幻覚」と呼ばれる誤った情報の生成に対抗するために調整されており、複雑な指示の遵守にも優れている
  • ML2は簡潔な応答を生成するよう最適化されており、長い回答はビジネスコンテキストでは望ましいとは限らない
  • ML2は商用ライセンスが必要なMistral Research Licenseで提供される

ML2は他のトップモデルと競合しながらも、リソースの効率的な利用によって高いパフォーマンスを達成している点が注目されます。また、幻覚対策や簡潔な応答生成においても優れた性能を発揮しています。

元記事: https://www.theregister.com/2024/07/25/mistral_large_2/