- AlibabaのAI研究部門Qwenは、ソフトウェア開発向けに設計された新しいシリーズのAIモデル「Qwen-2.5-Coder」をリリース
- Qwen-2.5-Coderは、開発者がコードを書く、分析する、理解するのを支援
- 6つの異なるモデルサイズがあり、0.5から32億のパラメータがある
- Qwenは、これらのモデルをAIパワードのコードエディタ「Cursor」とウェブベースのチャットボットでテスト
- 最大のモデルである「Qwen-2.5-Coder-32B-Instruct」は、コード生成のベンチマークで他のオープンソースシステムを上回った
- モデルは、9月に導入されたQwen 2.5の一般データミックスと、公開ソースコードとプログラミング関連のWebコンテンツからのデータを使ってトレーニング
- 「Qwen-2.5-Coder-32B-Instruct」は40以上のプログラミング言語をサポート
- AlibabaはApache 2.0ライセンスですべてのモデルをGitHubにリリース
- Qwenの研究者は、モデルサイズとデータの拡張がプログラミングタスク全体で優れた結果をもたらすことを発見
私の考え: AlibabaのQwenチームは、ソフトウェア開発のためのAIモデルを開発し、その性能と柔軟性を強調しています。大規模なデータとモデルサイズのスケーリングによって、プログラミングタスクにおいて優れた結果を達成していることが興味深いです。今後のリリースで推論能力を向上させるというQwenの計画も期待されます。