技術記事の要約
- 米国の研究者が、50ドル未満の訓練コストで最近のOpenAIモデルを上回る性能を発揮する革新的な手法を開発
- Alibaba Groupのオープンソース技術を使用して開発されたS1推論モデルは、50ドル未満で訓練され、特定のタスクで最近のOpenAIモデルを上回った
- 研究者は、AlibabaのQwen2.5-32b-Instructをベースモデルとして使用し、これはHugging Faceから昨年最もダウンロードされたモデルであった
- S1は、GoogleのGemini Thinking Experimentalモデルから抽出された1000の選択された質問と“思考プロセス”の回答で訓練され、OpenAIのo1-previewを凌駕した
- 研究者のアプローチである“test-time scaling”は、AIモデルが回答を提供する前に考慮する時間を増やすことを含む
感想
低コストで高性能なAIモデルを訓練する手法の開発は、AI技術の進歩にとって重要です。Alibaba Groupのオープンソース技術を活用し、研究者らがS1推論モデルを開発した成果は素晴らしいものです。特に、GoogleのGemini Thinking Experimentalモデルからの“思考プロセス”の活用や“test-time scaling”というアプローチは興味深いものです。今後も低コストで効果的なAIモデルの開発が進んでいくことを期待したいです。
元記事: https://www.silicon.co.uk/e-innovation/artificial-intelligence/research-ai-cost-599073