Anthropic はこのたび、同社の Claude 3.5 Sonnet モデルを全面的にアップグレード。PCを操作する機能を新たに追加し、コーディング能力でもさらなるブレークスルーを達成しました。今回のアップデートには、新たに発表された Claude 3.5 Haiku モデルも含まれており、製品ラインアップが一層充実しています。本記事では、注目すべき新機能について解説します。
Claude 3.5 Sonnet にPC操作機能が追加
新版 Claude 3.5 Sonnet の最大の注目点は、PCを操作できるようになったことです。Anthropic は専用の API を構築し、モデルがコンピューターのインターフェースを認識し、人間と同様に対話できるようにしました。開発者はこの API を統合することで、Claude にカーソルの移動、ボタンのクリック、フォームへの入力などの操作を実行させることが可能です。
OSWorld ベンチマークでは、Claude 3.5 Sonnet はスクリーンショットのみのモードで 14.9% のスコアを記録し、他の AI システムを大きく上回りました。現時点ではスクロールやドラッグ&ドロップに課題が残るものの、Asana や Replit といった著名企業がすでにこの機能をテストしています。この能力は、反復的なワークフローの自動化に新たな可能性をもたらします。
コーディング能力の大幅向上と性能最適化
新しい Claude 3.5 Sonnet は、コーディング性能で飛躍的な進化を遂げました。SWE-bench Verified テストでは、前世代の 33.4% から 49.0% へスコアが向上し、o1-preview を含む多くの推論モデルを上回りました。初期の顧客フィードバックによると、GitLab が同モデルを DevSecOps タスクに使用したところ、推論能力が 10% 向上し、レイテンシーは増加しなかったとのことです。

