- DeepSeekは、OpenAIのo1推論能力を模倣し、ベンチマークでの性能において、アメリカのモデルビルダーに挑戦している
- DeepSeekは、低コストで高い競争力を持つ機械学習モデルを公開
- DeepSeek V3は、14.8兆トークンを使用して2,048のNvidia H800sでトレーニングされ、約5.58百万ドルかかった
- DeepSeek R1は、6710億のパラメータを持ち、CoT推論を利用して訓練されており、数学的推論においてOpenAIのo1と競合する
- DeepSeekのR1モデルは、中国共産党の批判や政治的に敏感な質問には回答を拒否する
DeepSeekの記事によると、DeepSeekのモデルは、OpenAIのo1と同等の性能を持ちながら、低コストで競争力のある機械学習モデルを提供しているようです。特にDeepSeek R1は、数学的推論において高い性能を発揮し、CoT推論を使用して複雑な問題を解決します。ただし、DeepSeekのモデルは、中国共産党に批判的な質問には回答を拒否することが示されています。
元記事: https://www.theregister.com/2025/01/26/deepseek_r1_ai_cot/