• 中国のスタートアップは、米国の研究所が開発したものよりもはるかに少ない費用でモデルを訓練したと主張している
  • DeepSeekは、新しいAIモデルのコストと性能に関する主張に続き、テック企業がAI市場に投資したことで株価が下落した
  • DeepSeekのR1 LLM(大規模言語モデル)は、先週リリースされたもので、OpenAIやMetaが開発したものと同等であるように見えるが、DeepSeekは、より進んだチップを使用し、約550万ドルのコストでモデルを訓練したと主張している
  • 一方、OpenAIの訓練および推論コストは、2024年7月には年間70億ドルに達する可能性が報告され、先週同社はMGX、Oracle、SoftBankとの共同事業である「The Stargate Project」を発表し、AIインフラへの5000億ドルの投資を予定している
  • 先週、MetaのCEOであるマーク・ザッカーバーグは、同社が主にデータセンターやサーバーに600-650億ドルの資本支出を計画しており、AI能力を拡張しようとしていることを発表した

DeepSeekの主張により、Nvidia、Microsoft、Metaなどの株価が下落し、DeepSeekはAppleの米国App Storeで最もダウンロードされたアプリとなった。ただし、DeepSeekのハードウェアと訓練コストに関する主張は検証されていない。

DeepSeekは、米国が先進的なAI半導体に対する制裁を敷き、中国企業がOpenAIやMetaがモデルを訓練する際に使用するハードウェアにアクセスできなくなったため、古いNvidia A100チップの在庫と、米国政府の輸出規制に違反しないようにNvidiaが中国市場向けに特別に設計したH800sというAIチップを使用したと述べた。

DeepSeekの技術によって市場が動揺しているが、同社のハードウェアおよび訓練コストに関する主張は検証されていないことに留意すべきである。

多くの中国企業が、シンガポールなどの二次市場を通じて最先端のNvidiaチップを入手する方法を見つけていると報告されている。

自分の考え:DeepSeekの主張が事実であれば、AIモデルの訓練におけるコスト削減と効率化が可能となり、競争が一層激化する可能性がある。一方で、検証されていない主張に基づいて市場が揺れ動くことは、信頼性の面で懸念される。AI技術の進化と市場競争が今後どのように展開していくのか、注目したい。

元記事: https://www.datacenterdynamics.com/en/news/nvidia-meta-and-microsoft-shares-slump-on-deepseek-ai-training-claims/