要約

  • 東京を拠点とするRhymes AIが開発した多モーダルLLM「Aria」は、テキスト、コード、画像、ビデオを単一のアーキテクチャ内で処理可能。
  • 「Aria」は巨大なモデルではなく、Mixture-of-Experts(MoE)フレームワークを使用しており、特定の専門分野やタスクに優れたトレーニングを受けた専門家チームのようなアーキテクチャ。
  • ベンチマークテストでは、競合モデルを上回る性能を発揮しており、Apache 2.0ライセンスの下でオープンソースとしてリリース。
  • 「Aria」は、金融レポートの分析や天候データの可視化、ビデオ処理、コーディングなど、さまざまなタスクに対応。
  • 他のモデルと比較して、一部のタスクにおいては改善の余地があるが、そのアーキテクチャ、オープン性、スケーラビリティにより有望な競合モデルとして位置付けられる。

感想

「Aria」は革新的なモデルであり、その効率性やオープンソース性は注目に値する。競合力があり、さまざまなタスクに対応できる可能性がある一方で、改善の余地もある。オープンソースAIの発展に寄与する重要な一歩であり、今後の展開に期待が高まる。

元記事: https://decrypt.co/286132/aria-new-open-source-multimodal-ai-rivaling-big-tech