疑わしいDeepSeekのデビューがAIインフラの推進に打撃を与える

ByManagetech

1月 28, 2025

要約:

DeepSeekがオープンソースのR1大規模言語モデルをリリースし、OpenAIと同等の能力を報告
DeepSeekのトレーニングランは約600万ドルの費用で行われた可能性
DeepSeekは14兆のトークンでトレーニングされ、2,000のGPUを使用
DeepSeekはOpenAIの顧客であり、データセットを購入することで、データをスクレイピングする手間を省く
アメリカと中国の間でAIインフラと計算サイクルの競争が続いている
DeepSeekは効率的なツールを構築し、AIスケーリングの莫大なコストに対処するための取り組みが行われている

考察:

モデルトレーニングの効率化は、AI業界の重要な議論の一環であり、DeepSeekは効果的なツールを効率的な方法で構築したように見えます。アメリカと中国の間でAIインフラ投資の展望は依然として前向きであり、短期的な市場動向にもかかわらず、開放的なアプローチと効率的なモデルトレーニングがスケールの重要な要素であることが示唆されています。

元記事: https://www.rcrwireless.com/20250127/ai-infrastructure/deepseek-debut-dings-ai-infrastructure