- DeepSeekが新しいR1モデルファミリーをMITライセンスのもとで公開
- 最大のバージョンは6710億のパラメータを含む
- R1モデルはOpenAIのo1モデルといくつかのベンチマークで比較可能な性能を発揮
- DeepSeekは主要なR1-Zero、R1モデルに加えて、1.5億から70億のパラメータを持つ6つの小さな”DeepSeek-R1-Distill”バージョンも公開
- MITライセンスのモデルであり、誰もが学習、改変、商業利用が可能
- R1モデルは推論時の推論アプローチを取り入れており、人間のような思考過程を模倣
- DeepSeekのR1は数々のベンチマークでOpenAIのo1を上回る性能を示す
- クラウドホスティングされた場合には中国の規制により特定のトピックに関する回答を生成しない可能性あり
- DeepSeekのR1が他の研究所のモデルと競合し、AIモデルの普及が進む可能性あり
私の意見:DeepSeekの新しいR1モデルは、MITライセンスのもとで公開され、OpenAIのo1と競合する性能を持つことが注目されています。推論時の推論アプローチを取り入れたこのモデルは、数々のベンチマークで好成績を収めています。ただし、中国の規制によりクラウドホスティングされた場合には特定のトピックに関する回答が制限される可能性もあるため、その点には注意が必要です。AIモデルの普及が進み、ランニングコストが低いローカルハードウェアで実行可能なモデルが増えることは、AIコミュニティにとって良い方向に進んでいると感じます。
元記事: https://arstechnica.com/ai/2025/01/china-is-catching-up-with-americas-best-reasoning-ai-models/