- 2024年5月に発表されたGoogle Cloudの最新TPU、Trilliumは、大規模なトレーニング、チューニング、推論を向上したパフォーマンスとコスト効率で処理するよう設計されたAIチップの6世代モデル。
- Trilliumは、前任のTPU v5eに比べてトレーニングパフォーマンスが4倍以上、推論スループットが最大3倍向上するなど、大幅な改善が約束されており、特に大規模な言語モデルや計算集約型推論アプリケーションに適している。
- Trilliumのエネルギー効率にも焦点を当て、従来世代と比較して67%の向上を主張している。
- GoogleはベンチマークテストでTrilliumのパフォーマンスが大幅に向上し、Gemma 2-27bやLlama2-70Bなどのモデルのトレーニングスピードが4倍向上し、推論タスクではTPU v5eより3倍のスループットを達成した。
- Trilliumはスケーリングも強みとし、単一の高帯域ポッドに最大256チップを接続し、GoogleのJupiterデータセンターネットワーク内で数千のチップに拡張できる。
Trilliumは、大きな言語モデルや計算集約型推論アプリケーション向けに大幅なパフォーマンス向上を約束するGoogle Cloudの最新TPUであり、トレーニングおよび推論のパフォーマンス向上、エネルギー効率向上、スケーリングの強みが特徴的です。