アンスロピック社の最新AIモデル、Claude 3.5 Sonnetが新たに公開され、コンピュータを視覚的に操作できる機能がベータ版として提供開始されました。この「コンピュータ使用」と名付けられた機能により、Claudeは画面を見てカーソルを動かし、ボタンをクリックし、テキストを入力することが可能になります。この機能はAPIを通じて利用でき、開発者はClaudeに対し、人間のようにコンピュータ上で作業を指示することができます。\n\nこの新機能は、リリース初期段階であるため「まだ実験的」とされ、使い勝手には課題もあるとのこと。アンスロピックは「団体からのフィードバックを得るために早期にリリースした」と述べ、今後の改善に期待を寄せています。\n\n一方で、Microsoftの「Copilot Vision」機能やOpenAIのChatGPTデスクトップアプリ、GoogleのGeminiアプリなども、コンピュータ画面を視覚的に認識し、それに基づいて様々な操作を行う能力を持っていますが、これまでのところ、ユーザーの代わりに多くのタスクを自動的に実行する広範なツールとしての提供には至っていません。\n\nまた、Claudeはソーシャルメディアへの関与を避けるよう設定されており、選挙関連活動へのエンゲージメントについては特に注意が払われています。このため、政治的内容を生成や投稿したり、ウェブサイトに登録したりすることは控えられています。\n\nさらに、Claude 3.5 Sonnetは、さまざまなベンチマークテストでの性能向上も報告されており、前モデルと同価値、同速度で提供されています。特にエージェントプログラミングやツール使用のタスクで大きな進展が見られ、具体的にはSWE-bench Verifiedでの結果が33.4%から49.0%に改善され、公開されている他のすべてのモデルを上回りました。航空業界のタスクでも大幅な改善が見られ、今後のAI利用がますます期待されています。