ミストラル、テキストと画像の両方を処理できるマルチモーダル AI モデル Pixtral 12B を発表

ミストラル、テキストと画像の両方を処理できるマルチモーダル AI モデル Pixtral 12B を発表 – SiliconANGLE

ByManagetech

9月 12, 2024

技術記事要約：

パリを拠点とする人工知能スタートアップMistral AIが、画像とテキストの両方を処理できる最新の高度なAIモデル「Pixtral 12B」を発表。
Pixtral 12Bは約120億のパラメータを使用し、テキストを理解することができるMistralの以前にリリースされたAIモデル「Nemo 12B」に、4億のパラメータを持つビジョンアダプターを追加。
他の多くの大規模言語モデルも、Anthropic PBCのClaudeファミリーやOpenAIのGPT-4o、Google LLCのGeminiなど、マルチモーダル機能を追加しており、Pixtral 12Bに画像に関する質問に答えたり、キャプションを付けたり、オブジェクトを数えたりする能力を提供。
会社は、パラメータとコードをGitHubとAI配布プラットフォームHugging Faceにトレントリンクで公開し、開発者にダウンロードと使用を奨励。
モデルがダウンロード可能になったことで、開発者は独自の目的のためにモデルを微調整してトレーニングできるようになる。
開発者向けに一部のモデルをApache 2.0ライセンスのもとオープンソースで提供する一方、商用アプリケーションには有料ライセンスが必要。
Mistralの開発者リレーション担当Sophia Yangは、モデルがMistralのチャットボットとAPIプラットフォームであるLe ChatとLe Platformeでテスト可能になると述べた。

感想：

最新のPixtral 12Bモデルは画像とテキストを処理できる新たな可能性をもたらすと感じます。このモデルがオープンソースで提供されることで、開発者がさまざまな用途に適合させる機会が増えることは素晴らしいと思います。

元記事: https://siliconangle.com/2024/09/11/mistral-unveils-pixtral-12b-multimodal-ai-model-can-process-text-images/

ミストラル、テキストと画像の両方を処理できるマルチモーダル AI モデル Pixtral 12B を発表 – SiliconANGLE

ByManagetech

技術記事要約：

感想：

By Managetech

Related Post

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

研究者たちは現在、ロボットに AI を組み込んで物理的な作業を実行させている | ノーザンパブリックラジオ: WNIJ および WNIU

マイクロソフトが誤ってWindows 11から嫌われているAI機能を削除したことにユーザーが歓喜

You missed

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

JFrogとNVIDIAが提携し、安全なAI導入を強化

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY