- 中国のAIスタートアップDeepSeekが新しいR1モデルをMITライセンスの下でリリース
- DeepSeekによるオープンソースの推論AIモデル、DeepSeek-R1が複数のベンチマークでOpenAIのo1と同等
- DeepSeekは1か月前にDeepSeek-V3を発表し、ビッグテックのライバルが構築したAIモデルを大幅に上回る性能を発揮
- DeepSeek-R1はOpenAIの相当モデルよりも90-95%安く構築されたと主張
- DeepSeek Reasonerは、OpenAIのo1が$15の入力トークンごとに$60の出力トークンを要するのに対し、DeepSeek Reasonerは$0.55の入力トークンごとに$2.19の出力トークンを要する
- DeepSeek-R1-ZeroとDeepSeek-R1を含むモデル群には、1.5億から700億パラメータの6つのコンパクトなDeepSeek-R1-Distillモデルが含まれる
- 研究者らはDeepSeek-R1-Zeroバリアントを強化学習でトレーニングし、その後DeepSeek-R1を構築した
この記事では、中国のAIスタートアップDeepSeekが新しいR1モデルをMITライセンスの下でリリースしたことが紹介されています。DeepSeekは、OpenAIのo1と同等の複数のベンチマークで優れた性能を発揮するオープンソースの推論AIモデル、DeepSeek-R1を含むモデル群を発表しました。DeepSeekは、他社のモデルよりも90-95%安く構築されたことを主張し、性能面でも優れていると述べています。