- Alibaba CloudがTongyi Qianwen大規模言語モデル(LLM)ファミリーの最新バージョンQwen2をリリース
- Qwen2は0.5億から72億のパラメータを持つ5つのバリエーションで提供
- 27言語に加えて中国語と英語をカバーするデータで事前学習されており、多言語の能力を持つ
- Qwen2は数学、プログラミング、自然科学、社会科学、工学、人文科学などのタスクで優れたパフォーマンスを発揮
- Qwen2-72BモデルはMetaのLlama 3-70Bを上回ると主張されているが、Elo Arenaベンチマークでは下位にランク付け
- 広いコンテキストウィンドウを持つことで長いコンテンツを処理するのに適している
- ‘Needle in a Haystack’テストで優れた結果を達成し、大きなコンテキストから情報を抽出する能力を示す
- ほとんどのQwen2モデルにApache 2.0ライセンスが採用されており、オープンソースソフトウェアの標準的なプラクティスに準拠
Alibaba CloudのQwen2は、多言語対応、高性能、広いコンテキストウィンドウなどの特長を持ち、他のオープンソースモデルに対する強力な競合となっている。Apache 2.0ライセンスの採用はオープンソースソフトウェアとしての透明性を高めている。