DeepSeek-R1: 最高のオープンソース推論 LLM が OpenAI-o1 を上回る | Mehul Gupta 著 | ポケットの中のデータサイエンス | 2025 年 1 月

DeepSeek-R1: 最高のオープンソース推論 LLM が OpenAI-o1 を上回る | Mehul Gupta 著 | ポケットの中のデータサイエンス | 2025 年 1 月 | Medium

ByManagetech

1月 21, 2025

DeepSeekがDeepSeek-V3の後にDeepSeek-R1とDeepSeek-R1-Zeroをリリース
DeepSeek-R1はDeepSeek-R1-Zeroを使用してトレーニングされたベースモデル
DeepSeek-R1-Zero、DeepSeek-R1、および6つの蒸留モデルがHuggingFaceでオープンソース化
大規模強化学習（RL）のみを使用してトレーニングされ、RLに完全に依存している
自己検証、反射、長い思考連鎖（CoT）の推論挙動を備えている
課題：無限の反復、読みにくさ、言語混在などの問題
RLを適用する前に冷たいスタートデータを取り込むことで挑戦に対処
DeepSeek-R1-Distill-Qwenシリーズ：1.5B、7B、14B、32B
DeepSeek-R1-Distill-Llamaシリーズ：8B、70B
性能：蒸留モデルはOpenAI-o1-miniを上回り、密なモデルにおける最先端の結果を達成
AIME 2024（Pass@1）、Codeforces（Percentile）、GPQA Diamond（Pass@1）などの様々なベンチマークにおいて成績が優れている

DeepSeek-R1とR1-Zeroは、主要なベンチマークでOpenAI-o1などの競合他社を凌駕し、革新的なトレーニング技術とオープンソースの利用可能性により、開発者に最先端のAIを幅広いアプリケーションで活用する力を与えています。進んだ推論タスクに取り組んだり、蒸留モデルで縮小したりする場合でも、DeepSeekは柔軟性と性能を提供しています。ぜひモデルを試してみてください！

Youtubeチャンネル

GenAIコース＆プロジェクト

元記事: https://medium.com/data-science-in-your-pocket/deepseek-r1-best-open-source-reasoning-llm-outperforms-openai-o1-b79869392945

DeepSeek-R1: 最高のオープンソース推論 LLM が OpenAI-o1 を上回る | Mehul Gupta 著 | ポケットの中のデータサイエンス | 2025 年 1 月 | Medium

ByManagetech

By Managetech

Related Post

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

研究者たちは現在、ロボットに AI を組み込んで物理的な作業を実行させている | ノーザンパブリックラジオ: WNIJ および WNIU

マイクロソフトが誤ってWindows 11から嫌われているAI機能を削除したことにユーザーが歓喜

You missed

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

JFrogとNVIDIAが提携し、安全なAI導入を強化

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY