• Galileo Technologies Inc.がAgentic Evaluationsを発表
  • AIエージェントのパフォーマンスを評価するプラットフォーム
  • エージェントは意思決定能力を持ち、複数のステップでタスクを実行
  • Gartnerによると、2028年までに33%の企業ソフトウェアアプリケーションにagentic AIが含まれる見込み
  • Agentic Evaluationsは開発者にシステムレベルとステップごとの評価を提供
  • プラットフォームはLLM-as-a-Judgeメトリクスを使用してパフォーマンスを評価
  • 開発者は複数のLLMを選択して計画を評価し、個々のタスクのエラーを評価可能
  • 総合的なトラッキングにより、コスト、遅延、エラーを把握可能
  • Galileo Technologies Inc.は$68 millionを調達し、Agentic Evaluationsを提供

Galileo Technologies Inc.のAgentic EvaluationsはAIエージェントのパフォーマンス評価に革新をもたらすプラットフォームであり、開発者にシステム全体およびステップごとの評価を提供します。このプラットフォームはLLM-as-a-Judgeメトリクスを使用し、開発者がエージェントを構築する際に特に役立ちます。独自の研究ベースのメトリクスを使用してパフォーマンスを測定し、コスト、遅延、エラーを追跡することで、開発者が効率的に問題を特定し、改善できるようサポートします。

元記事: https://siliconangle.com/2025/01/23/galileo-unleashes-platform-evaluating-ai-agents/