- Anthropicの最新のClaude 3.5 Sonnet AIモデルには、新機能の「computer use」があり、APIで利用可能。
- この機能は、画面を見てコンピューターを操作し、カーソルを移動させ、ボタンをクリックし、テキストを入力することができる。
- 他社のAIツール(MicrosoftのCopilot Vision、OpenAIのChatGPTデスクトップアプリ、GoogleのGeminiアプリ)は、コンピューター画面を見て作業することができるが、Anthropicの「computer use」ほどのツールは広く提供されていない。
- Anthropicは、「computer use」はまだ実験的で手間がかかり、誤りが起こる可能性があると警告している。
- Claudeの画面表示方法が不十分であり、一部のアクション(ドラッグ、ズームなど)を実行できない。
- Claudeは、ソーシャルメディアから遠ざけられ、特定の活動(選挙関連の活動、ソーシャルメディアでのコンテンツ生成や投稿)を行わないように設定されている。
- Anthropicは、Claude 3.5 Sonnetモデルに多くの改善があり、前モデルと同じ価格と速度で顧客に提供されている。
- 更新されたClaude 3.5 Sonnetは、業界ベンチマークで幅広い改善が見られ、特にエージェンティックコーディングやツール利用タスクで強力な成果を収めている。
私の考え:
このAnthropicのClaude 3.5 Sonnet AIモデルは、コンピューターを人間のように操作する「computer use」機能が注目される一方、まだ実験的で改善の余地があるという点に注意が必要です。ソーシャルメディアへの介入を避けるなど、倫理的な配慮も行われているようで、AI技術の使用において重要な側面が考慮されています。また、モデルの性能向上により、業界のベンチマークでも優れた成績を収めており、AIの進化が続いていることが示唆されています。
元記事: https://www.theverge.com/2024/10/22/24276822/anthopic-claude-3-5-sonnet-computer-use-ai