• DeepSeek R1はOpenAIのo1と比較して、わずか3%から5%のコストで合格率が同等になる。
  • このAI LLMは、人間が学ぶのと同様に、試行錯誤または強化学習(RL)を通じて完全に自己教育を行った。
  • DeepSeek R1は、機械的な強化学習を通じて主に学習し、OpenAIに比べてクエリを実行するコストが$0.14という低価格である。
  • DeepSeek-R1-Zero、DeepSeek-R1、およびDeepSeek-R1から抽出された6つの密なモデル(1.5B、7B、8B、14B、32B、70B)がオープンソース化され、研究コミュニティをサポートする。

この技術は、OpenAIのo1と比較してコストが安いだけでなく、強化学習を通じて学習し、機械的なフィードバックを通じて最適な方法を見つけ出す点で優れています。研究コミュニティへの貢献も重要であり、オープンソース化されたモデルはさまざまな活用の可能性を示しています。

元記事: https://www.techeblog.com/china-open-source-deepseek-r1-openai-o1/