- NVIDIAの新しいGeForce RTX 5090は、DeepSeek R1上での推論パフォーマンスがAMDのRX 7900 XTXよりもはるかに速く、これは新しい第5世代Tensor Coresのおかげとされています。
- GeForce RTX 5090は、Distill Qwen 7bおよびDistill Llama 8bにおいて、最大で1秒あたり200トークンを処理し、AMDのRX 7900 XTXのほぼ2倍の性能を達成しています。
- NVIDIAのGPUのAIパフォーマンスが支配的であり、広範な「RTX on AI」サポートにより、コンシューマーPC上でのエッジAIがより頻繁に見られるでしょう。
- NVIDIAのDeepSeek-R1モデルは、NVIDIA NIMマイクロサービスプレビューとして公開され、単一のNVIDIA HGX H200システムで1秒あたり3,872トークンを提供できます。
- NVIDIAのNIMを使用することで、開発者や愛好家はローカルビルドでAIモデルを簡単に試すことができ、データが保護されるだけでなく、ローカルで実行することで性能が向上する可能性があります。
この記事では、NVIDIAのGeForce RTX 5090がAMDのRX 7900 XTXを凌駕する推論性能を示し、AIパフォーマンスにおいてNVIDIAのGPUが強力であることが強調されています。また、NVIDIAのDeepSeek-R1モデルがNVIDIA NIMマイクロサービスとして提供され、開発者や企業がAIモデルを安全に試し、展開することが可能となっています。