水. 4月 1st, 2026

Meta AI が Chameleon を発表: マルチモーダル機械学習の新たな基準を確立する、早期融合トークンベースの基盤モデルの新ファミリー – MarkTechPost

ByManagetech

5月 19, 2024

要約:

Chameleonは、混合モーダル基盤モデルで、テキストと画像シーケンスを交互に生成および推論することを可能にする。
Chameleonは、画像をテキストのようにトークン化する統合アーキテクチャを採用し、両方のモダリティを均等に取り扱う。
Chameleonは、画像トークナイザーを開発し、トレーニング技術を提案し、安定性の問題を解決するためにQK-Norm、ドロップアウト、z-loss正則化を使用する。
Chameleonは、テキストのみの能力を最新のモデルと比較し、共感推論や数学などのタスクで競争力のある性能を達成する。
Chameleonは、画像キャプショニングやビジュアル質問応答などのタスクでFlamingoやIDEFICSなどの大きなモデルを凌駕したり、匹敵することができる。

感想:

Chameleonは、画像とテキストのトークンをシームレスに統合することで、優れた性能を発揮するモデルである。そのアーキテクチャは、モダリティ間での共同推論を可能にし、画像キャプショニングやビジュアル質問応答などのタスクで、遅延フュージョンモデルを凌駕している。Chameleonのアーリーフュージョンアプローチは、安定したトレーニングに対する新しいテクニックを導入し、以前の拡張性の課題に対処している。新しいマルチモーダルインタラクションの可能性を開拓し、混合モーダルのオープンエンドQAベンチマークでの強力なパフォーマンスがそれを裏付けている。

元記事: https://www.marktechpost.com/2024/05/18/meta-ai-introduces-chameleon-a-new-family-of-early-fusion-token-based-foundation-models-that-set-a-new-bar-for-multimodal-machine-learning/

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech