• Deepseek社が最新のV3言語モデルをリリース
  • V3は業界の主要なプロプライエタリモデルと肩を並べ、特に論理推論タスクで改善
  • 6710億の総パラメータを持ち、各トークンに370億のアクティブパラメータを使用
  • V2の倍のトレーニングデータを処理し、2.788百万時間のH800 GPUで訓練
  • 処理速度が3倍速くなり、論理推論の改善に重点
  • 主なLLMベンチマークで最高スコアを達成
  • 価格性能比で業界最高とされ、API価格は2月8日まではV2レートで維持
  • Deepseekライセンス契約(Version 1.0)の下でリリース
  • DeepseekはAGIへの段階的アプローチを取り、数学やコーディング向けの特化モデルを提供

Deepseek社が新しいV3言語モデルをリリースし、V3は業界の主要なプロプライエタリモデルと肩を並べる性能を持っています。トレーニングデータの増加や効率的なアルゴリズム、フレームワーク、ハードウェアの最適化により、V3は印象的な速度と論理推論の改善を実現しています。Deepseekは価格性能比で業界最高を提供し、将来的にAGIへの道を進んでいます。

元記事: https://the-decoder.com/deepseek-v3-emerges-as-chinas-most-powerful-open-source-language-model-to-date/