要約:
- 中国のAI企業DeepSeekが、推論モデルDeepSeek-R1のオープンバージョンをリリース。
- R1モデルは、いくつかのAIベンチマークでOpenAIのo1を上回る性能を持つ。
- R1モデルは、商用利用に制約がないMITライセンスのもと、Hugging FaceのAI開発プラットフォームで利用可能。
- DeepSeekは、R1モデルがAIME、MATH-500、SWE-bench Verifiedのベンチマークでo1を上回ると主張。
- R1モデルは、自身の結果を自己検証する能力を持ち、他のモデルがよく引っかかる一般的な問題を防ぐ。
- R1モデルには6710億のパラメータがあり、問題解決能力が高い。
- DeepSeekは、R1モデルの「蒸留版」もリリース。1.5億から700億のパラメータを持ち、最小のものはノートパソコンで実行可能。
- 完全版のR1モデルは高性能なハードウェアを必要とするが、価格はOpenAIのo1よりもはるかに安い。
- R1モデルは中国発祥のため、中国のインターネット規制当局の監視下にあり、敏感なトピックには回答しない。
- 中国のAIシステムにおいて、国の規制当局にとって論争を招く可能性があるトピックは避けるのは一般的な慣行。
コメント:
R1モデルは、パラメータ量が多いため問題解決能力が高く、推論モデルとして信頼性が高いことが特長です。中国発祥のため、規制当局の監視下にあるという制限はあるものの、価格と性能のバランスが特筆すべき点です。