- h2o.aiが、h2oGPTe Agentを通じてGAIA(General AI Assistants)ベンチマークの1位を獲得し、スコア65%でGoogleのLangfun Agent(49%)、Microsoft Research(38%)、Hugging Face(33%)を上回る。
- GAIAベンチマークは、AIシステムの実世界のタスク解決能力を測定し、h2oGPTe Agentは一貫した堅牢性、正確性、効率性を提供し、企業向けの用途に適していることを示している。
- h2o.aiのCEOは、AIがGAIAベンチマークで人間レベルの一般知能に30%しか及んでいないことを共有し、h2oGPTe Agentが競合を圧倒していることを述べた。
- h2oGPTe Agentは、世界最高のモデルを駆使してGAIAベンチマークで驚異的な15%の正確性向上を達成し、Microsoft ResearchのMagentic-1を27%上回った。
h2o.aiの成功は、AI革新におけるリーダーシップを再確認し、ビジネスワークフローを再構築するエージェント技術に特に焦点を当てている。