• 中国のAIスタートアップDeepSeekが新しいR1モデルをMITライセンスの下でリリース
  • DeepSeekによるオープンソースの推論AIモデル、DeepSeek-R1が複数のベンチマークでOpenAIのo1と同等
  • DeepSeekは1か月前にDeepSeek-V3を発表し、ビッグテックのライバルが構築したAIモデルを大幅に上回る性能を発揮
  • DeepSeek-R1はOpenAIの相当モデルよりも90-95%安く構築されたと主張
  • DeepSeek Reasonerは、OpenAIのo1が$15の入力トークンごとに$60の出力トークンを要するのに対し、DeepSeek Reasonerは$0.55の入力トークンごとに$2.19の出力トークンを要する
  • DeepSeek-R1-ZeroとDeepSeek-R1を含むモデル群には、1.5億から700億パラメータの6つのコンパクトなDeepSeek-R1-Distillモデルが含まれる
  • 研究者らはDeepSeek-R1-Zeroバリアントを強化学習でトレーニングし、その後DeepSeek-R1を構築した

この記事では、中国のAIスタートアップDeepSeekが新しいR1モデルをMITライセンスの下でリリースしたことが紹介されています。DeepSeekは、OpenAIのo1と同等の複数のベンチマークで優れた性能を発揮するオープンソースの推論AIモデル、DeepSeek-R1を含むモデル群を発表しました。DeepSeekは、他社のモデルよりも90-95%安く構築されたことを主張し、性能面でも優れていると述べています。

元記事: https://www.thehindu.com/sci-tech/technology/chinese-ai-firm-deepseek-unveils-open-source-reasoning-model-deepseek-r1-beats-openais-o1/article69127316.ece