- DeepSeekがMITライセンスの下で新しいR1モデルファミリーをリリース
- 最大のバージョンは6710億のパラメータを持つ
- DeepSeek-R1-ZeroとDeepSeek-R1モデルのリリースとともに、6つの小さな”DeepSeek-R1-Distill”バージョンも公開
- DeepSeekによると、R1は数学やコーディングのベンチマークでOpenAIのo1に匹敵する性能を発揮
- R1モデルは、一般的な大規模言語モデル(LLMs)と異なり、推論時の推論アプローチを取り入れている
この記事によると、DeepSeekの新しいR1モデルファミリーはMITライセンスの下でリリースされ、OpenAIのo1モデルに匹敵する性能を数学やコーディングのベンチマークで発揮しています。DeepSeek-R1-ZeroやDeepSeek-R1などのモデルの他に、1.5兆から70兆のパラメータを持つ6つの小さな”DeepSeek-R1-Distill”バージョンも公開されました。R1モデルは推論時の推論アプローチを取り入れており、OpenAIのo1と同様の性能を示しています。
私の考え:DeepSeekのR1モデルのリリースは、AIコミュニティの注目を集めており、MITライセンスの下で利用可能なAIモデルの可能性に変化をもたらしています。推論アプローチを取り入れたこの新しいモデルは、オープンソースのアーキテクチャからデータを生成し、推論を行うことで、従来のモデルとは異なる方法で動作しています。
元記事: https://arstechnica.com/ai/2025/01/china-is-catching-up-with-americas-best-reasoning-ai-models/