- Metaが昨日オープンソースモデルLlama 3.1をリリースし、フランスの人工知能スタートアップMistralも参入
- Mistral Large 2は1230億パラメータを持ち、コード生成、数学、論理面で前モデルより強力
- Mistral Large 2は128kのコンテキストウィンドウを持ち、中国語を含む数十の言語をサポート
- モデルの精度はMMLUで84.0%であり、コード生成、論理、多言語サポートで大幅な改善
- Large 2は幻覚問題を最小限に抑えることに重点を置いており、返答が的確でない場合は不確かさを認める
- 非商用研究目的での「オープン認可」が可能であり、商用利用には別途ライセンスと使用契約が必要
- Mistral Large 2はLlama 3.1よりパラメータが少ないが、性能はほぼ同等
- 同社の主要プラットフォームおよびクラウドパートナーを介して入手可能であり、高度な多言語機能や性能向上が特長
- 公式にGPT-4レベルモデルと呼ばれ、ベンチマークでGPT-4o、Llama 3.1-405、AnthropicのClaude 3.5 Sonnetに匹敵
- 製品はコスト効率、速度、性能の境界を押し広げ続け、高性能AIアプリケーションの構築に新機能を提供
この記事では、Mistralが新しいモデルLarge 2をリリースしたことが紹介されています。モデルはパラメータ数が増え、コード生成や多言語サポートなどで大幅に改善されています。Large 2は幻覚問題の最小化に重点を置き、返答の的確性を向上させています。また、非商用研究目的ではオープン認可が可能ですが、商用利用にはライセンスが必要です。性能面ではLlama 3.1に近い結果を示しており、高度な機能を備えたGPT-4レベルモデルとして位置づけられています。