• FuriosaAIがHot Chips 2024でAIアクセラレータRNGDを発表
  • RNGDは、高性能大規模言語モデルおよびマルチモーダルモデルの推論のための最も効率的なデータセンターアクセラレータと位置付けられている
  • RNGDの主な革新点には、Tensor Contraction Processor(TCP)ベースのアーキテクチャが含まれる
  • RNGD PCIeカード1枚で、約100億のパラメータを持つモデルに対して1秒あたり2,000〜3,000トークンのスループット性能を提供
  • RNGDは、効率、プログラマビリティ、パフォーマンスの完全なバランスを実現する

私の考え:FuriosaAIのRNGDは、効率的でプログラマブルかつ高性能なデータセンターアクセラレータであり、大規模な言語モデルやマルチモーダルモデルの推論において優れた成果を示しています。TCPベースのアーキテクチャやプログラマビリティの向上、効率性の向上など、革新的な要素が特徴です。GPT-JやLlama 3.1などの大規模言語モデルに対しても高い性能を発揮し、業界の実際のニーズに応える持続可能でアクセス可能なAIコンピューティングソリューションとなっています。

元記事: https://www.thefastmode.com/technology-solutions/36941-furiosaai-launches-ai-accelerator-chip-rngd-for-high-performance-llm-inference