• Salesforceが新しいオープンソースの大規模マルチモーダルAIモデルのスイートをリリース
  • xGen-MM(BLIP-3とも呼ばれる)はテキスト、画像、その他のデータタイプを組み合わせたコンテンツを理解し生成するAIの能力を大幅に向上
  • xGen-MMフレームワークには、事前学習済みモデル、データセット、ファインチューニング用コードが含まれている
  • 4兆のパラメータを持つ最大モデルは、類似サイズのオープンソースモデルと比較してさまざまなベンチマークで競争力のある性能を発揮
  • xGen-MMの主要なイノベーションは、複数の画像とテキストを組み合わせた「交互データ」を処理できる能力
  • リリースには、異なる目的に最適化されたモデルのバリエーションが含まれており、AIコミュニティによる機能と安全性、倫理的考慮のバランスへの意識が反映されている
  • Salesforceのオープンソースリリースは、分野内のイノベーションを大幅に加速させる可能性があり、他のテックジャイアントにも影響を与えるかもしれない

この記事では、Salesforceがオープンソースで大規模マルチモーダルAIモデルをリリースしたことが強調されています。xGen-MMは、テキスト、画像、その他のデータタイプを組み合わせたコンテンツを理解し生成するAIの能力を大幅に向上させる革新的なモデルであり、AI研究の発展を促進する可能性があります。Salesforceのこのオープンソースリリースは、分野内のイノベーションを加速し、他のテックジャイアントにも影響を与えるかもしれません。

元記事: https://venturebeat.com/ai/salesforce-releases-xgen-mm-open-source-multimodal-ai-models-to-advance-visual-language-understanding/