• NVIDIAの新しいGeForce RTX 5090は、DeepSeek R1上での推論パフォーマンスがAMDのRX 7900 XTXよりもはるかに速く、これは新しい第5世代Tensor Coresのおかげとされています。
  • GeForce RTX 5090は、Distill Qwen 7bおよびDistill Llama 8bにおいて、最大で1秒あたり200トークンを処理し、AMDのRX 7900 XTXのほぼ2倍の性能を達成しています。
  • NVIDIAのGPUのAIパフォーマンスが支配的であり、広範な「RTX on AI」サポートにより、コンシューマーPC上でのエッジAIがより頻繁に見られるでしょう。
  • NVIDIAのDeepSeek-R1モデルは、NVIDIA NIMマイクロサービスプレビューとして公開され、単一のNVIDIA HGX H200システムで1秒あたり3,872トークンを提供できます。
  • NVIDIAのNIMを使用することで、開発者や愛好家はローカルビルドでAIモデルを簡単に試すことができ、データが保護されるだけでなく、ローカルで実行することで性能が向上する可能性があります。

この記事では、NVIDIAのGeForce RTX 5090がAMDのRX 7900 XTXを凌駕する推論性能を示し、AIパフォーマンスにおいてNVIDIAのGPUが強力であることが強調されています。また、NVIDIAのDeepSeek-R1モデルがNVIDIA NIMマイクロサービスとして提供され、開発者や企業がAIモデルを安全に試し、展開することが可能となっています。

元記事: https://wccftech.com/nvidia-geforce-rtx-5090-dominates-inference-performance-on-deepseeks-r1-ai-models/