- Googleは、Agentic AIによって推進される成長著しいAIベースの自動化市場でシェアを獲得するために、AnthropicやOpenAIといったプレーヤーと共にAIベースのコンピュータ利用戦に参入している。
- Googleは、Gemini 2.0の大規模言語モデル(LLM)を活用して、Chromeブラウザ上で調査やショッピングなどのタスクを自動化するJarvisを開発中。
- Jarvisは、スクリーンショットの読み取りや理解、テキストの生成、ユーザーとのインタラクションのシミュレートなど、複数のLLMベースの開発技術を組み合わせて行動を制御し、ブラウザ上でタスクを完了する能力を持つ。
- Anthropicの「コンピュータ利用」機能は、開発者がClaude 3.5 SonnetをAnthropic APIを介して指示し、ディスプレイの内容を読み取り解釈し、テキストを入力し、カーソルを移動させ、ボタンをクリックし、ウィンドウやアプリケーションを切り替えることが可能。
- GoogleのAIを使用したユーザータスクの自動化の取り組みは、企業を含めて幅広い用途で利用可能であり、多くの開発活動やワークフロー管理、CRM、ERPなどがブラウザ経由でアクセスされるため、企業でも利用される可能性がある。
私の考え:
Googleや他の大手企業がAIを活用してコンピュータの操作を自動化する取り組みを進めていることは、今後のテクノロジーの進化にとって非常に興味深いです。特に、ユーザーのタスクを効率的に処理するためのAIベースの代理人やLLMの活用は、ビジネスや個人にとって革新的な影響を与える可能性があります。