オープンソースの DeepSeek-R1 は、純粋な強化学習を使用して OpenAI o1 に匹敵しますが、コストは 95% 低くなります | VentureBeat

ByManagetech

1月 21, 2025

DeepSeek社が新しいオープン推論LLM「DeepSeek-R1」をリリース
DeepSeek-R1は数学、コーディング、推論タスクでOpenAIのフロンティア推論LLM o1と同等の性能を持ち、コストは90-95%割安
DeepSeekはR1を使用して6つのモデルを蒸留し、性能を向上させた
AGI（人工一般知能）へのレースでオープンモデルが商用モデルに追いついていることを示すリリース
DeepSeek-R1はRLと教師付き微調整の組み合わせを使用し、複雑な推論タスクを処理
DeepSeek-R1は数学テストとコーディングベンチマークで高いスコアを達成し、人間のプログラマーを上回る
DeepSeek-R1はオープンソースであり、MITライセンスのもとで利用可能

DeepSeekの新しいオープン推論LLM「DeepSeek-R1」は、コストパフォーマンスに優れ、AGIへのレースでオープンモデルが商用モデルに追いついていることを示すリリースです。DeepSeek-R1はRLと教師付き微調整を組み合わせて複雑な推論タスクを処理し、数学テストとコーディングベンチマークで高いスコアを達成しています。

元記事: https://venturebeat.com/ai/open-source-deepseek-r1-uses-pure-reinforcement-learning-to-match-openai-o1-at-95-less-cost/