- AnthropicのClaude 3.5 Sonnet大規模言語モデルが、コンピュータを操作する能力を獲得
- 新しい能力は、「コンピュータの使用」と呼ばれ、ベータテスト中
- Claude 3.5 Sonnetは、目標を定義し、必要な手順を特定し、スクリーンショットをスキャンして操作手順を決定
- Claude 3.5 Sonnetは画像内の機能の座標を返す能力を持ち、ボタンやテキストボックスにカーソルを配置
- Anthropicは、コンピュータの使用能力がAI開発における変化を表すと主張
私の考え:Claude 3.5 Sonnetのコンピュータ使用能力は革新的であり、RPA市場に変化をもたらす可能性があると考えられます。ただし、現在はベータ版であり、いくつかの制限があるため、慎重な使用が求められると感じます。