• Googleは、Agentic AIによって推進される成長著しいAIベースの自動化市場でシェアを獲得するために、AnthropicやOpenAIといったプレーヤーと共にAIベースのコンピュータ利用戦に参入している。
  • Googleは、Gemini 2.0の大規模言語モデル(LLM)を活用して、Chromeブラウザ上で調査やショッピングなどのタスクを自動化するJarvisを開発中。
  • Jarvisは、スクリーンショットの読み取りや理解、テキストの生成、ユーザーとのインタラクションのシミュレートなど、複数のLLMベースの開発技術を組み合わせて行動を制御し、ブラウザ上でタスクを完了する能力を持つ。
  • Anthropicの「コンピュータ利用」機能は、開発者がClaude 3.5 SonnetをAnthropic APIを介して指示し、ディスプレイの内容を読み取り解釈し、テキストを入力し、カーソルを移動させ、ボタンをクリックし、ウィンドウやアプリケーションを切り替えることが可能。
  • GoogleのAIを使用したユーザータスクの自動化の取り組みは、企業を含めて幅広い用途で利用可能であり、多くの開発活動やワークフロー管理、CRM、ERPなどがブラウザ経由でアクセスされるため、企業でも利用される可能性がある。

私の考え:

Googleや他の大手企業がAIを活用してコンピュータの操作を自動化する取り組みを進めていることは、今後のテクノロジーの進化にとって非常に興味深いです。特に、ユーザーのタスクを効率的に処理するためのAIベースの代理人やLLMの活用は、ビジネスや個人にとって革新的な影響を与える可能性があります。

元記事: https://www.cio.com/article/3591801/google-prepares-jarvis-to-fight-the-ai-computer-use-war.html