• h2o.aiが、h2oGPTe Agentを通じてGAIA(General AI Assistants)ベンチマークの1位を獲得し、スコア65%でGoogleのLangfun Agent(49%)、Microsoft Research(38%)、Hugging Face(33%)を上回る。
  • GAIAベンチマークは、AIシステムの実世界のタスク解決能力を測定し、h2oGPTe Agentは一貫した堅牢性、正確性、効率性を提供し、企業向けの用途に適していることを示している。
  • h2o.aiのCEOは、AIがGAIAベンチマークで人間レベルの一般知能に30%しか及んでいないことを共有し、h2oGPTe Agentが競合を圧倒していることを述べた。
  • h2oGPTe Agentは、世界最高のモデルを駆使してGAIAベンチマークで驚異的な15%の正確性向上を達成し、Microsoft ResearchのMagentic-1を27%上回った。

h2o.aiの成功は、AI革新におけるリーダーシップを再確認し、ビジネスワークフローを再構築するエージェント技術に特に焦点を当てている。

元記事: https://aithority.com/machine-learning/generative-ai/ai-is-only-30-away-from-matching-human-level-general-intelligence-on-gaia-benchmark/