土. 6月 27th, 2026

GAIAベンチマークでAIが人間レベルの汎用知能に匹敵するまでの差はわずか30%

ByManagetech

12月 24, 2024

h2o.aiが、h2oGPTe Agentを通じてGAIA（General AI Assistants）ベンチマークの1位を獲得し、スコア65％でGoogleのLangfun Agent（49％）、Microsoft Research（38％）、Hugging Face（33％）を上回る。
GAIAベンチマークは、AIシステムの実世界のタスク解決能力を測定し、h2oGPTe Agentは一貫した堅牢性、正確性、効率性を提供し、企業向けの用途に適していることを示している。
h2o.aiのCEOは、AIがGAIAベンチマークで人間レベルの一般知能に30％しか及んでいないことを共有し、h2oGPTe Agentが競合を圧倒していることを述べた。
h2oGPTe Agentは、世界最高のモデルを駆使してGAIAベンチマークで驚異的な15％の正確性向上を達成し、Microsoft ResearchのMagentic-1を27％上回った。

h2o.aiの成功は、AI革新におけるリーダーシップを再確認し、ビジネスワークフローを再構築するエージェント技術に特に焦点を当てている。

元記事: https://aithority.com/machine-learning/generative-ai/ai-is-only-30-away-from-matching-human-level-general-intelligence-on-gaia-benchmark/

By Managetech

Related Post

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech

研究者たちは現在、ロボットに AI を組み込んで物理的な作業を実行させている | ノーザンパブリックラジオ: WNIJ および WNIU

3月 18, 2025 Managetech

マイクロソフトが誤ってWindows 11から嫌われているAI機能を削除したことにユーザーが歓喜

3月 18, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech