• DeepSeekは2025年にオープンソースの大規模言語モデル(LLM)分野で登場し、「最大の黒馬」として注目された。
  • DeepSeek V3は6710億のパラメータを持ち、およそ5.58百万ドルの費用で約2ヶ月間のトレーニングを受けた。
  • DeepSeekのV3モデルは、大手テック企業が投資するよりも少ないコンピューティングリソースを使用している。
  • DeepSeekは、より費用対効果の高いトレーニングを実現するための新しいアーキテクチャを活用している。
  • DeepSeekの開発は、中国のAI企業が進化していることを示しており、米国の制裁にもかかわらず進歩している。

DeepSeekは、大手企業がかけるコストよりも少ない投資で強力なLLMを開発したことから、中国のAI企業の進歩を示しています。米国の制裁にもかかわらず、新しいアーキテクチャを活用してコスト効率の良いトレーニングを実現しました。

元記事: https://www.yahoo.com/tech/meet-deepseek-chinese-start-changing-093000172.html