土. 7月 12th, 2025

GPU なしで強力な LLM を実現する新しい Transformer アーキテクチャ | VentureBeat

ByManagetech

6月 14, 2024

UCサンタクルーズ大学、東海大学、UCデイビス大学の研究者が新しいアーキテクチャを開発
MatMul-free言語モデルの導入により、大規模なメモリ使用量と推論時の遅延を軽減
MatMul操作を3つの状態（-1、0、+1）の3ビットテナリー重みで置き換え
MatMul-freeアーキテクチャは推論時のメモリ使用量と遅延を削減
MLGRUとGLUを用いてトークンミキサーとチャネルミキサーを実装し、MatMul操作を排除
MatMul-free LMは性能を維持しつつ、メモリ使用量と遅延を削減
MatMul-free LMはTransformer++よりも効率的で、ゼロショットパフォーマンスが高い

研究ではMatMul-freeアーキテクチャにより、大規模な言語モデルの効率向上が示されました。このアーキテクチャはMatMul操作を置き換え、メモリ使用量と遅延を軽減しつつ、性能を維持できることが示されました。

元記事: https://venturebeat.com/ai/new-transformer-architecture-could-enable-powerful-llms-without-gpus/

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech