- Allen Institute for AI(Ai2)が、Molmoというオープンソースの最先端の多面的AIモデルファミリーを発表
- Molmoは、OpenAIのGPT-4o、AnthropicのClaude 3.5 Sonnet、GoogleのGemini 1.5などのトッププロプライエタリライバルを上回る性能を発揮
- Molmoは、画像やファイルを受け入れて分析できる多面的なモデルで、プロプライエタリの基礎モデルと同様の機能を持つ
- Molmoは、プロプライエタリライバルよりも「1000倍少ないデータ」を使用し、トレーニング技術による
- モデルは、スマートフォンで使用し、ユーザーが写真を撮影してAIに送信することで、シーン内の人数を数えたり、メニューアイテムがヴィーガンかどうかを判断したり、手書きメモをテーブルに変換したりすることができる
私の考え:Molmoは非常に革新的なマルチモーダルな基礎モデルであり、AIコミュニティに革新と協力を促進するAi2の広いビジョンの一環として、これらのモデルとデータセットをアクセス可能にしています。