火. 3月 17th, 2026

この中国の法学修士課程の学生がOpenAIの主要推論モデルを破った

ByManagetech

1月 21, 2025

Summary in Japanese

要約:

中国のAI企業DeepSeekが、推論モデルDeepSeek-R1のオープンバージョンをリリース。
R1モデルは、いくつかのAIベンチマークでOpenAIのo1を上回る性能を持つ。
R1モデルは、商用利用に制約がないMITライセンスのもと、Hugging FaceのAI開発プラットフォームで利用可能。
DeepSeekは、R1モデルがAIME、MATH-500、SWE-bench Verifiedのベンチマークでo1を上回ると主張。
R1モデルは、自身の結果を自己検証する能力を持ち、他のモデルがよく引っかかる一般的な問題を防ぐ。
R1モデルには6710億のパラメータがあり、問題解決能力が高い。
DeepSeekは、R1モデルの「蒸留版」もリリース。1.5億から700億のパラメータを持ち、最小のものはノートパソコンで実行可能。
完全版のR1モデルは高性能なハードウェアを必要とするが、価格はOpenAIのo1よりもはるかに安い。
R1モデルは中国発祥のため、中国のインターネット規制当局の監視下にあり、敏感なトピックには回答しない。
中国のAIシステムにおいて、国の規制当局にとって論争を招く可能性があるトピックは避けるのは一般的な慣行。

コメント:

R1モデルは、パラメータ量が多いため問題解決能力が高く、推論モデルとして信頼性が高いことが特長です。中国発祥のため、規制当局の監視下にあるという制限はあるものの、価格と性能のバランスが特筆すべき点です。

元記事: https://www.newsbytesapp.com/news/science/deepseek-s-ai-model-outperforms-openai-s-o1-on-specific-benchmarks/story

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech