GenAI の次の一手: AI「エージェント」を人間のように動作させる方法

スタートアップヨーロッパ。大人のレポート。
GenAI の時代になってから 1 年以上経ちますが、AI「エージェント」は、もうすぐ登場する次なる大きなトレンドです。
これらのツールは、人間からのクエリに一つずつ答えるだけでなく、一連のタスクやジョブを独自に実行するように強力な大規模モデルを最適化することを約束しており、2023年3月にスコットランドを拠点とする開発者Toran Bruce RichardsがAI Twitterで大々的に投稿したAutoGPTをリリースしたことで、主流の盛り上がりが始まりました。
しかし、GenAI の世界の多くの開発と同様に、本当に役立つ結果や製品がすぐに提供されることはなく、ほとんどの人が AutoGPT のようなツールを使用して新しいものを作成することをすぐに忘れてしまったようです。
現在、アムステルダムに本社を置くソフトウェア開発および投資会社 Prosus Group の新しいレポートによると、これらの AI エージェントは、かなり深刻な制限はあるものの、一部のビジネスコンテキストで有用になり始めているとのことです。
本日発表されたレポートでは、AIエージェントとその配信プラットフォームを構築している94社を分析し、ツールは3つの主要なサブセクターに分類できることがわかった。これには、職場の生産性などの「一般的なタスク」、営業開発担当者などの特定の仕事を実行する「機能固有の」エージェント、特定の職業のさまざまなタスクの自動化を目指す「業界固有の」エージェントなどに焦点を当てたものがある。
Prosus Group のデータサイエンス担当シニアディレクター、Paul van der Boor 氏は、まず機能に特化したエージェントが市場で勝利する可能性が高いと Sifted に語っています。
「職務記述書のように、かなり明確に定義されたことを彼らに教えたり、指示したりするのです」と彼は言う。「私たちの経験では、そこは彼らをかなりうまく働かせることができる場所なので、とても興奮する場所です。」
機能特化型エージェントのスタートアップ企業として人気を集めている例として、ロンドンを拠点とする 11x が挙げられます。同社は「デジタルワーカー」、つまり営業開発担当者 (SDR) の仕事をこなせる AI エージェントを開発しています。
1月に、創業者兼CEOのハサン・スッカー氏はSiftedに対し、リードをうまく打ち合わせにつなげることに関しては、同社のデジタルワーカーは人間のベンチマークを上回ることができると語った。
「平均的な労働者よりも優秀になることは、実際には難しいことではありません」と彼は言います。「顧客からの初期のフィードバックは、これが非常に大きな ROI をもたらすというものでした。当社の顧客の 1 社は、これを大規模に使用しており、システムが単独で行っている方法で、10 人のスタッフが SDR 機能を運営していました。」
しかし、スッカー氏は、11x の AI エージェントが最高の人間を上回るパフォーマンスを発揮するのはまだ難しいと述べ、これがこの技術の大きな限界の 1 つであると指摘している。
ChatGPT のような大規模言語モデル (LLM) は、本質的には文中の次の単語が何であるかを統計的に予測するものであり、一貫した応答と結果を提供するという点では本質的に予測不可能で信頼性がありません。
「基本的に、これらのエージェントの行動を管理できなければなりませんが、その行動は往々にして非決定論的になりがちです」とファン・デル・ブール氏は説明します。「質問をした場合、同じ質問を 10 回繰り返しても、エージェントが確実に同じ答えを返すようにする必要があります。」
彼は、現在 AI エージェントの進歩を妨げているもう一つの大きな要因は、定期的に間違いを犯すことが知られている GenAI モデルの精度に関する問題だと付け加えます。「多くのユースケースでは 100% の精度、あるいは 99% 以上の精度が求められます。」
価格の問題もあります。GenAI モデルは実行に大量のデータとエネルギーを必要とするため、モデルに大量のリクエストが行われるとコストが急上昇する可能性があります。
「コストは急速に下がっていますが、特に事業規模を考えると、さらに下げる必要があると思います」とファン・デル・ブール氏は言う。「経済的に成り立つためには、はるかに安くならなければなりません。」
11xのスッカー氏は1月にSiftedに対し、同社のより高度なモデルの中には1時間当たり12ドルもかかるものもあり、これは多くの国の最低賃金を上回ると語った。
こうした制限にもかかわらず、ファン・デル・ブール氏は、エージェントは「GenAIの次の一手」になると述べ、Prosusは、エドテック企業のUdemyやデリバリープラットフォームのGlovoやiFoodなど、ポートフォリオ企業の多くと協力してデータ分析ツールを開発していると付け加えた。
これにより、SQL などのデータベース用プログラミング言語に関する専門知識を持たない企業の従業員でも、顧客行動などについて自然言語で AI に質問できるようになります。すると、エージェントがその情報を見つける方法と、回答を提示する最適な方法を考え出します。
「このエージェントは、クエリを受け取り、基本的に一連のアクションを実行して、「これにどう答えるか？どのテーブルを調べる必要があるか？実行したい SQL クエリは何か？自分が書いたコードを批評してから実行させてください。そして、答えを検証させてください」といったことを理解しようとします」と van der Boor 氏は説明します。
同氏によると、開発チームは、AI が自身の作業を批評するのに役立つテクノロジーに重点を置き、また AI が扱うメタデータの品質にも重点を置くことで、エージェントの信頼性と精度を向上させたという。
ファン・デル・ブール氏は、大規模な AI モデルの記憶力と計画力を向上させる技術が開発されるにつれて、エージェントは自らの行動を規定する「ビジネスルール」を理解する能力がさらに高まると考えています。これにより、将来的には職場のさまざまなタスクに適応できる、より汎用的なツールが実現する可能性があります。
現時点では「まだ非常に初期段階」であり、AIがごく初級職以外の職務全体を置き換える未来はまだまだ遠いと彼は言う。
Zenlyの創設者がAMOで復帰 — 今回は買い手を探していない
パイレーツ・ベイのピーター・サンデ氏：「テクノロジーを善のために使う人はいない。特にフィンテックでは」
PhotoRoom がフランスの人気若手 GenAI ブームになった経緯
ティム・スミスはSiftedのニュース編集者です。ディープテックとAIをカバーし、Startup Europe – The Sifted Podcastを制作しています。XとLinkedInでフォローしてください。
VCとLPは「軍民両用」の防衛技術について自らを欺くのをやめるべきだ
「軍民両用」の投資家であっても、武器への資金提供の倫理的影響を考慮する必要がある
マイクロソフトとグーグルが支援するAIリーガルテックスタートアップが700万ドルを調達
英国に拠点を置くDefinelyは、AI製品をさらに開発し、米国での拡大に投資すると発表
ディープテックVCが聞きたい10の売り込み
SiftedはディープテックのVC5人に、今注目しているものについて尋ねた。

元記事: https://sifted.eu/articles/ai-agents-prosus-startup

GenAI の次の一手: AI「エージェント」を人間のように動作させる方法 | Sifted

ByManagetech

By Managetech

Related Post

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

JFrogとNVIDIAが提携し、安全なAI導入を強化

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

You missed

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

JFrogとNVIDIAが提携し、安全なAI導入を強化

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY