• Anthropicは画面ビジョンを超える最初の企業の1つである
  • Anthropicは、ユーザーのマウスカーソルを制御し、コンピュータ上で基本的なタスクを実行できる新しいツールを発表
  • ツールは、「Computer Use」と呼ばれ、APIを介して現在は同社の中位の3.5 Sonnetモデルでのみ利用可能
  • Anthropicによると、ツールは画面を見てカーソルを動かし、ボタンをクリックし、テキストを入力することで、ユーザーのコンピュータ上でタスクを達成する
  • ツールは、ライブビデオストリームではなく、連続したスクリーングラブを取ることによって動作し、一部の一般的なアクション(例:ドラッグ&ドロップ)を実行できない

考察:

Anthropicの新しいツール「Computer Use」はユーザーのマウスカーソルを制御し、コンピュータ上でタスクを実行する革新的なアプローチを示しています。このようなツールはオフィス業務における多くの単純作業を自動化し、開発者にとっては繰り返しのタスクを自動化し、労力のかかるQAや最適化作業を合理化する有用なツールとなる可能性があります。ただし、このような技術の普及には多くの懸念があり、Anthropicはそのような悪用を予防するための保護策を講じています。現在、公開テストが行われており、問題点を洗い出し、開発者と協力して機能を向上させ、ポジティブな活用法を見つける過程にあるようです。

元記事: https://arstechnica.com/ai/2024/10/anthropic-publicly-releases-ai-tool-that-can-take-over-the-users-mouse-cursor/