• Gemma 3は、Gemmaファミリーの次世代モデルであり、昨年リリースされたGemma 2の後継機である。
  • パラメータサイズ1B、4B、12B、27Bの範囲で提供され、128Kトークンの長いコンテキストウィンドウをサポート。
  • Gemma 3は、ビデオ、画像、テキストの解析が可能で、35言語をネイティブでサポートし、140言語の事前トレーニングも提供。
  • Gemma 3 27Bは、Chatbot ArenaでDeepSeek-V3、OpenAIのo3-mini、MetaのLlama 3-405Bモデルを上回った。
  • Gemma 3 27Bは、MMLU-Pro、GPQA Diamondなどの標準ベンチマークで67.5%と42.4のスコアを獲得。

私の感想:

GoogleのGemma 3は、効率的な計算利用を持つことが強みであり、他のモデルが最大32台のGPUを必要とする中、Gemma 327Bは1つのNVIDIA H100 GPUでスコアを達成したという点が注目されます。また、Googleはモデルのアーキテクチャを変更して、長いコンテキストに伴うKV-キャッシュメモリの削減を実現しています。Gemma 3の技術的な詳細や性能などについての報告書が公開されており、様々な方法でアクセス可能です。さらに、GoogleはGemma 3と同じ基盤を活用した4Bパラメータの画像安全チェッカーであるShieldGemma 2も発表しており、有害な画像に対する安全ラベルを提供しています。

元記事: https://analyticsindiamag.com/ai-news-updates/googles-new-ai-model-outperforms-deepseek-v3-openais-o3-mini/