Deepseek V3 は、これまでで最も強力な中国オープンソース言語モデルとして登場しました。

ByManagetech

12月 27, 2024

Deepseek社が最新のV3言語モデルをリリース
V3は業界の主要なプロプライエタリモデルと肩を並べ、特に論理推論タスクで改善
6710億の総パラメータを持ち、各トークンに370億のアクティブパラメータを使用
V2の倍のトレーニングデータを処理し、2.788百万時間のH800 GPUで訓練
処理速度が3倍速くなり、論理推論の改善に重点
主なLLMベンチマークで最高スコアを達成
価格性能比で業界最高とされ、API価格は2月8日まではV2レートで維持
Deepseekライセンス契約（Version 1.0）の下でリリース
DeepseekはAGIへの段階的アプローチを取り、数学やコーディング向けの特化モデルを提供

Deepseek社が新しいV3言語モデルをリリースし、V3は業界の主要なプロプライエタリモデルと肩を並べる性能を持っています。トレーニングデータの増加や効率的なアルゴリズム、フレームワーク、ハードウェアの最適化により、V3は印象的な速度と論理推論の改善を実現しています。Deepseekは価格性能比で業界最高を提供し、将来的にAGIへの道を進んでいます。

元記事: https://the-decoder.com/deepseek-v3-emerges-as-chinas-most-powerful-open-source-language-model-to-date/