- Galileo Technologies Inc.がAgentic Evaluationsを発表
- AIエージェントのパフォーマンスを評価するプラットフォーム
- エージェントは意思決定能力を持ち、複数のステップでタスクを実行
- Gartnerによると、2028年までに33%の企業ソフトウェアアプリケーションにagentic AIが含まれる見込み
- Agentic Evaluationsは開発者にシステムレベルとステップごとの評価を提供
- プラットフォームはLLM-as-a-Judgeメトリクスを使用してパフォーマンスを評価
- 開発者は複数のLLMを選択して計画を評価し、個々のタスクのエラーを評価可能
- 総合的なトラッキングにより、コスト、遅延、エラーを把握可能
- Galileo Technologies Inc.は$68 millionを調達し、Agentic Evaluationsを提供
Galileo Technologies Inc.のAgentic EvaluationsはAIエージェントのパフォーマンス評価に革新をもたらすプラットフォームであり、開発者にシステム全体およびステップごとの評価を提供します。このプラットフォームはLLM-as-a-Judgeメトリクスを使用し、開発者がエージェントを構築する際に特に役立ちます。独自の研究ベースのメトリクスを使用してパフォーマンスを測定し、コスト、遅延、エラーを追跡することで、開発者が効率的に問題を特定し、改善できるようサポートします。
元記事: https://siliconangle.com/2025/01/23/galileo-unleashes-platform-evaluating-ai-agents/