- Mistral AIが画像とテキストの両方を処理できる最新のAIモデルPixtral 12Bを発表
- Pixtral 12Bは120億のパラメータを使用し、ビジョンエンコーディングが可能で、テキストと一緒に画像を解釈できる
- MistralAIのNemo 12Bモデルをベースに構築され、400百万のパラメータビジョンアダプターなどの機能が追加されている
- MistralAIのSophia Yangは、GitHubとHugging Faceでトレントリンクを介してモデルをダウンロードでき、Apache 2.0ライセンスで制限なく使用できると共有
- Mistral AIはフランスに拠点を置き、2023年にMetaとGoogleの元従業員によって設立された
- Mistral AIはオープンソースアプローチを採用し、すべてのモデルを無料で使用および改変できるオープンライセンスでリリース
- Mistral AIのモデルは多様なデータセット(テキスト、コード、画像)で訓練されており、単一タイプで訓練されたものよりも汎用性が高い
私の考え:Mistral AIは、画像とテキストの処理を可能にする唯一無二のモデルPixtral 12Bを発表しました。彼らのオープンソースアプローチと多様なデータセットでの訓練により、汎用性の高いモデルを提供している点が注目されます。今後の展開に期待が持てるプロジェクトであると感じます。