• DeepSeek社が新しいオープン推論LLM「DeepSeek-R1」をリリース
  • DeepSeek-R1は数学、コーディング、推論タスクでOpenAIのフロンティア推論LLM o1と同等の性能を持ち、コストは90-95%割安
  • DeepSeekはR1を使用して6つのモデルを蒸留し、性能を向上させた
  • AGI(人工一般知能)へのレースでオープンモデルが商用モデルに追いついていることを示すリリース
  • DeepSeek-R1はRLと教師付き微調整の組み合わせを使用し、複雑な推論タスクを処理
  • DeepSeek-R1は数学テストとコーディングベンチマークで高いスコアを達成し、人間のプログラマーを上回る
  • DeepSeek-R1はオープンソースであり、MITライセンスのもとで利用可能

DeepSeekの新しいオープン推論LLM「DeepSeek-R1」は、コストパフォーマンスに優れ、AGIへのレースでオープンモデルが商用モデルに追いついていることを示すリリースです。DeepSeek-R1はRLと教師付き微調整を組み合わせて複雑な推論タスクを処理し、数学テストとコーディングベンチマークで高いスコアを達成しています。

元記事: https://venturebeat.com/ai/open-source-deepseek-r1-uses-pure-reinforcement-learning-to-match-openai-o1-at-95-less-cost/