- フランスのAIスタートアップ、Mistral AIが、画像とテキストの両方を処理できる高度なモデル「Pixtral 12B」をリリース
- 12 billionパラメータを持つPixtral 12Bは、400 millionパラメータのビジョンアダプターを含み、画像を処理可能
- 新モデルは、以前のNemo 12Bよりも画像の処理が可能で、URLやbase64エンコーディングを介して画像をアップロード可能
- AIモデルは、画像にキャプションを作成したり、写真やイラスト内のオブジェクトを数えたり、画像に関する一般的な質問に答えることが可能
- Mistral AIのSophia Yangによると、Pixtral 12BはLe ChatとLe Platformeにも利用可能で、誰でもチャットボットやAPI機能を試すことができる
新モデルのリリースは、AIの発展にとって非常に興味深いものであり、Mistral AIがオープンソースで積極的に開発者にモデルのダウンロードやトレーニングの促進を行っている姿勢は、AIコミュニティ全体にポジティブな影響を与える可能性があると感じます。