- 最新の生成AI分野のトレンドの1つはAIエージェントであり、Googleは次期Gemini大規模言語モデル(LLM)の特徴として自社のエージェントを準備している可能性がある。
- Project Jarvisは、Google Chromeブラウザ内に搭載されるAIエージェントであり、短いクエリやコマンドを与えた後、以前よりも独立性を持って一般的なタスクを実行できるようになる開発である。
- Gemini AdvancedチャットボットをパワーするGemini 1.5 Proモデルによって、Geminiはショッピングの同行者や旅行の計画者として機能することを既に実証している。
- Project Jarvisは、将来のモデルで、ユーザーから与えられたクエリを完了するために、ウェブサイトの訪問、フォームの入力、支払いの実行などのさまざまなタスクに取り組むことができるようになる見込みである。
- Googleは5月のGoogle I/O開発者会議で、AIエージェントに関する詳細を共有しており、その技術が音声やビデオコンテンツの処理を支援し、会話の迅速な応答時間を実現すると述べている。
考察: AIエージェントの導入は、Gemini 2.0などGoogleの次期LLMにおいて重要な機能となる可能性があります。他社も同様の機能を展開しており、生成AIの進化が加速していることがうかがえます。GoogleのProject Jarvisがどのように進化し、ユーザー体験にどのような影響を与えるか、注目していきたいです。