• DeepSeekのR1大規模言語モデルが1週間でChatGPTを破り、株式市場を揺さぶり、OpenAIおよび米国のAI産業支配に深刻な脅威をもたらしている。
  • DeepSeekはDeepSeek R1というオープンソースのLLMをリリースし、業界標準のベンチマークでの性能を発表。OpenAIのモデルを上回ると主張。
  • DeepSeek R1はオープンソースであり、誰もがアクセスして調整できる。プログラマはその内部構造を見ることができる。
  • DeepSeek R1はOpenAIのAPIアクセスに比べてかなり安価なAPIを持っており、プログラマがそれに殺到している。
  • DeepSeekエンジニアによると、R1モデルはわずか2,000のNvidiaチップだけで構築されたとされ、OpenAIのモデルよりはるかに少ない。

DeepSeek R1は、AI産業関係者やテック投資家にとって最も重要な成果は、(おそらく)その構築に必要とされる計算能力が非常に少なかったことである。DeepSeekエンジニアによると、R1モデルはわずか2,000のNvidiaチップのみが必要だったとされている。これは、2023年時点でOpenAIのモデルに必要とされた報告された10,000のNvidia GPUと比較されており、現在はさらに多いと考えられる。このような主張は大胆だが、真実であれば、現在進行中の5000億ドルのスターゲイトプロジェクトのようなデータセンターの開発にどれだけの投資が必要か疑問視されることになるだろう。株式市場はDeepSeek R1の(おそらくの)コスト効率を注視し、月曜日にNvidiaの株価が13%下落した。

DeepSeek R1の勢いが続くかどうかはわからないが、確かにAI競争を再燃させ、競争を世界的な高みに引き上げている。

元記事: https://mashable.com/article/deepseek-ai-chatgpt-rival-what-to-know