Galileo が AI エージェントを評価するためのプラットフォームを公開

Galileo が AI エージェントを評価するためのプラットフォームを公開 – SiliconANGLE

ByManagetech

1月 24, 2025

Galileo Technologies Inc.がAgentic Evaluationsを発表
AIエージェントのパフォーマンスを評価するプラットフォーム
エージェントは意思決定能力を持ち、複数のステップでタスクを実行
Gartnerによると、2028年までに33%の企業ソフトウェアアプリケーションにagentic AIが含まれる見込み
Agentic Evaluationsは開発者にシステムレベルとステップごとの評価を提供
プラットフォームはLLM-as-a-Judgeメトリクスを使用してパフォーマンスを評価
開発者は複数のLLMを選択して計画を評価し、個々のタスクのエラーを評価可能
総合的なトラッキングにより、コスト、遅延、エラーを把握可能
Galileo Technologies Inc.は$68 millionを調達し、Agentic Evaluationsを提供

Galileo Technologies Inc.のAgentic EvaluationsはAIエージェントのパフォーマンス評価に革新をもたらすプラットフォームであり、開発者にシステム全体およびステップごとの評価を提供します。このプラットフォームはLLM-as-a-Judgeメトリクスを使用し、開発者がエージェントを構築する際に特に役立ちます。独自の研究ベースのメトリクスを使用してパフォーマンスを測定し、コスト、遅延、エラーを追跡することで、開発者が効率的に問題を特定し、改善できるようサポートします。

元記事: https://siliconangle.com/2025/01/23/galileo-unleashes-platform-evaluating-ai-agents/

Galileo が AI エージェントを評価するためのプラットフォームを公開 – SiliconANGLE

ByManagetech

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

You missed

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

JFrogとNVIDIAが提携し、安全なAI導入を強化

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY