- アリババクラウドの最新の言語モデルシリーズであるQwen2は、金曜日に発売されるとすぐにオープンソースのLLMランキングで首位に立った。
- Qwen2モデルシリーズには、0.5から72 billionのパラメータを持ついくつかのベース言語モデルや指示チューニングされた言語モデルが含まれている。
- Qwen2-72Bモデルは、言語理解、言語生成、多言語能力、コーディング、数学、推論を含む15のベンチマークで他の主要なオープンソースモデルを凌駕する性能を発揮した。
- Qwen2モデルは、Group Query Attentionと呼ばれる技術を利用して、モデルの推論時により少ないメモリを使用しながら高速化を実現している。
- Qwen2モデルは、人間の価値観とよりよく一致するように人間のフィードバックを取り入れ、安全性と責任を向上させている。
アリババクラウドのQwen2シリーズは、言語処理やモデル効率性の面で優れた性能を示しており、さらなる発展が期待される。特に、人間の価値観との一致や安全性向上に取り組む姿勢は、AIの将来において重要な方向性であると考えられる。
元記事: https://www.alizila.com/alibaba-clouds-qwen2-with-enhanced-capabilities-tops-llm-leaderboard/