以下は、DeepSeek-R1というLLMソリューションが中国の企業によって開発され、その影響がわずか5日でアメリカにも及んでいることを伝える技術記事の要点です。
- 中国のDeepSeek-R1は、ChatGPTのようなLLMであり、より安価で効率的であり、リソースを大量に必要とするモデルに対抗し、インドなどの国々にとって代替可能なモデルと見なされている。
- Big Tech(Google、Microsoft、Facebook、Amazon)が改良されたソリューションを構築するために数十億ドルを投入している中、DeepSeekはコストを大幅に削減できるより良いプラットフォームを構築することでゲームを変えると約束している。
- このオープンソースモデルに基づく中国のモデルは、リソースのわずか10%で構築できると報告されており、グローバルサウスにとって巨大なエントリーバリアがある米国モデルとは異なる。
- このオープンソースモデルの革新的な強化学習(RL)ベースのアーキテクチャは、AIの推論能力を大幅に向上させていると専門家は述べている。
DeepSeekは、AIの普及が高コストに制限されていると述べており、DeepSeekのモデルはオープンソースとして利用可能であるため、以前は高額すぎたAIユースケースを組織が検討できるようになったとAI業界アナリストのKashyap Kompellaは述べている。
DeepSeekにはインターネットでの大きな反響があり、LLM分野を注視する人々が新しいプレーヤーについて話している。世界中の愛好家たちは、その利点や欠点について議論するためにプラットフォームやRedditなどに参加し、他の人々は新しいオープンソースアーキテクチャのパワーを活用するために、ラップトップや携帯電話にダウンロードする方法を説明する「How-To」ビデオやチュートリアルを作り始めています。