アラブ首長国連邦(UAE)に拠点を置くテクノロジー・イノベーション・インスティテュート(TII)は、大規模言語モデル(LLM)の新しいバージョンを発表しました。
TIIは月曜日(5月13日)のプレスリリースで、新型ファルコン2には画像からテキストへの変換機能を備えたモデルが含まれていると述べた。
リリースによると、新しい LLM の 2 つのバージョンのうちの 1 つである Falcon 2 11B VLM には、視覚入力をテキスト出力に変換できるビジョン言語モデル (VLM) 機能が搭載されています。
リリースによると、VLM 機能の潜在的な用途には、文書管理、デジタル アーカイブ、コンテキスト インデックス作成、視覚障害者のサポートなどが含まれる。
リリースによると、もう1つの新バージョンであるFalcon 2 11Bは、「より効率的でアクセスしやすいLLM」となるよう設計されている。5.5兆個のトークンと110億個のパラメータでトレーニングされており、事前トレーニング済みモデルの中で同クラスのAIモデルのパフォーマンスに匹敵するか、それを上回っている。
どちらのモデルも多言語対応で、リリースによれば、英語、フランス語、スペイン語、ドイツ語、ポルトガル語、その他さまざまな言語でタスクを処理できる。また、どちらもオープンソースで、世界中の開発者に制限のないアクセスを提供している。
リリースによれば、これらは 1 つのグラフィックス プロセッシング ユニット (GPU) 上で実行できるため、どちらもラップトップやその他のデバイスに統合できるという。
「AIは絶えず進化しており、開発者はより小型で効率的なモデルの無数のメリットを認識しています」と、TIIのAIクロスセンターユニットのエグゼクティブディレクター兼主任研究員代理であるハキム・ハシド博士はリリースで述べています。「コンピューティングパワー要件の削減と持続可能性基準の達成に加えて、これらのモデルは柔軟性を高め、次に出現するメガトレンドであるエッジAIインフラストラクチャにシームレスに統合します。」
企業が AI をより利用しやすくするために、より小型でコスト効率の高い AI モデルを開発する傾向があります。
「小規模なLLMは、ChatGPTやAnthropicのClaudeのような大規模な言語モデルに比べてユーザーに多くの制御を提供するため、多くの場合、より望ましいものになります」と、クラウドベースのAI搭載プラットフォームであるDialpadの共同創設者兼最高技術責任者であるブライアン・ピーターソン氏は、3月に掲載されたPYMNTSのインタビューで語った。「小規模なLLMは、より小さなデータのサブセットをフィルタリングできるため、より高速で、より手頃な価格で、独自のデータがある場合は、はるかにカスタマイズ可能で、さらに正確になります。」
当社は常に革新者や破壊者と提携する機会を探しています。

元記事: https://www.pymnts.com/artificial-intelligence-2/2024/technology-innovation-institute-launches-ai-model-with-vision-to-language-capabilities/