要約

  • DeepSeekのV3モデルは、ライバルよりもはるかに少ないコンピューティングリソースを使用して、US$5.58百万で2ヶ月間訓練されました。
  • オープンウェイトは、AIモデルの事前学習済みパラメータまたは重みのみを公開し、第三者が推論と微調整のみにモデルを使用できることを指します。モデルの訓練コード、元のデータセット、アーキテクチャの詳細、および訓練方法論は提供されません。

感想

DeepSeekのV3モデルが、少ないリソースで効率的に訓練されたことは興味深いです。オープンウェイトの概念は、モデルの利用を制限しながらも、他の利用者が活用できる可能性を提供しています。

元記事: https://amp.scmp.com/tech/tech-trends/article/3292507/chinese-start-deepseek-launches-ai-model-outperforms-meta-openai-products