• 2024年5月に発表されたGoogle Cloudの最新TPU、Trilliumは、大規模なトレーニング、チューニング、推論を向上したパフォーマンスとコスト効率で処理するよう設計されたAIチップの6世代モデル。
  • Trilliumは、前任のTPU v5eに比べてトレーニングパフォーマンスが4倍以上、推論スループットが最大3倍向上するなど、大幅な改善が約束されており、特に大規模な言語モデルや計算集約型推論アプリケーションに適している。
  • Trilliumのエネルギー効率にも焦点を当て、従来世代と比較して67%の向上を主張している。
  • GoogleはベンチマークテストでTrilliumのパフォーマンスが大幅に向上し、Gemma 2-27bやLlama2-70Bなどのモデルのトレーニングスピードが4倍向上し、推論タスクではTPU v5eより3倍のスループットを達成した。
  • Trilliumはスケーリングも強みとし、単一の高帯域ポッドに最大256チップを接続し、GoogleのJupiterデータセンターネットワーク内で数千のチップに拡張できる。

Trilliumは、大きな言語モデルや計算集約型推論アプリケーション向けに大幅なパフォーマンス向上を約束するGoogle Cloudの最新TPUであり、トレーニングおよび推論のパフォーマンス向上、エネルギー効率向上、スケーリングの強みが特徴的です。

元記事: https://www.techradar.com/pro/google-puts-nvidia-on-high-alert-as-it-showcases-trillium-its-rival-ai-chip-while-promising-to-bring-h200-tensor-core-gpus-in-november-2024