要約:
- Mistral Large 2は128kのコンテキストウィンドウを持ち、フランス語、ドイツ語、アラビア語、中国語など複数の言語をサポート
- Mistral Large 2は単一ノード推論向けに設計され、1230億のパラメータを搭載し、高いスループットを実現
- Mistral Large 2は研究や非商用利用向けのMistral Research Licenseで入手可能であり、商用展開にはMistral Commercial Licenseが必要
- モデルはパフォーマンスとコスト効率においてベンチマークを設定し、MMLU評価で84%の精度を達成
- Mistral Large 2は、コード生成と推論において前作を上回り、GPT-4o、Claude 3 Opus、Llama 3 405Bなどの主要モデルと同等の性能を持つ
感想:
Mistral Large 2は、複数の言語をサポートし、高いパフォーマンスと多機能性を備えた印象的なモデルであることが分かります。特に、コード生成や推論において高い精度を実現し、商用展開においても活用される可能性があると感じました。さらなる進歩と発展が期待されるAI技術の先駆けとなる取り組みであると言えます。
元記事: https://techmonitor.ai/technology/ai-and-automation/llm-mistral-large-2