- Anthropicは画面ビジョンを超える最初の企業の1つである
- Anthropicは、ユーザーのマウスカーソルを制御し、コンピュータ上で基本的なタスクを実行できる新しいツールを発表
- ツールは、「Computer Use」と呼ばれ、APIを介して現在は同社の中位の3.5 Sonnetモデルでのみ利用可能
- Anthropicによると、ツールは画面を見てカーソルを動かし、ボタンをクリックし、テキストを入力することで、ユーザーのコンピュータ上でタスクを達成する
- ツールは、ライブビデオストリームではなく、連続したスクリーングラブを取ることによって動作し、一部の一般的なアクション(例:ドラッグ&ドロップ)を実行できない
考察:
Anthropicの新しいツール「Computer Use」はユーザーのマウスカーソルを制御し、コンピュータ上でタスクを実行する革新的なアプローチを示しています。このようなツールはオフィス業務における多くの単純作業を自動化し、開発者にとっては繰り返しのタスクを自動化し、労力のかかるQAや最適化作業を合理化する有用なツールとなる可能性があります。ただし、このような技術の普及には多くの懸念があり、Anthropicはそのような悪用を予防するための保護策を講じています。現在、公開テストが行われており、問題点を洗い出し、開発者と協力して機能を向上させ、ポジティブな活用法を見つける過程にあるようです。