Claude 3.5 新機能解説：PC操作とコーディング能力が大幅進化

Anthropic はこのたび、同社の Claude 3.5 Sonnet モデルを全面的にアップグレード。PCを操作する機能を新たに追加し、コーディング能力でもさらなるブレークスルーを達成しました。今回のアップデートには、新たに発表された Claude 3.5 Haiku モデルも含まれており、製品ラインアップが一層充実しています。本記事では、注目すべき新機能について解説します。

Claude 3.5 Sonnet にPC操作機能が追加

新版 Claude 3.5 Sonnet の最大の注目点は、PCを操作できるようになったことです。Anthropic は専用の API を構築し、モデルがコンピューターのインターフェースを認識し、人間と同様に対話できるようにしました。開発者はこの API を統合することで、Claude にカーソルの移動、ボタンのクリック、フォームへの入力などの操作を実行させることが可能です。

OSWorld ベンチマークでは、Claude 3.5 Sonnet はスクリーンショットのみのモードで 14.9% のスコアを記録し、他の AI システムを大きく上回りました。現時点ではスクロールやドラッグ＆ドロップに課題が残るものの、Asana や Replit といった著名企業がすでにこの機能をテストしています。この能力は、反復的なワークフローの自動化に新たな可能性をもたらします。

コーディング能力の大幅向上と性能最適化

新しい Claude 3.5 Sonnet は、コーディング性能で飛躍的な進化を遂げました。SWE-bench Verified テストでは、前世代の 33.4% から 49.0% へスコアが向上し、o1-preview を含む多くの推論モデルを上回りました。初期の顧客フィードバックによると、GitLab が同モデルを DevSecOps タスクに使用したところ、推論能力が 10% 向上し、レイテンシーは増加しなかったとのことです。

さらに、最速の次世代モデルとして位置づけられる Claude 3.5 Haiku も、コーディングタスクで優れた成果を示しています。SWE-bench Verified で 40.6% のスコアを獲得し、多くの公開モデルを上回ると同時に、前世代の Haiku と同じコストと速度を維持しています。これらの改善により、Claude は複雑なソフトウェアエンジニアリングタスクにおいて、より信頼性の高い動作を実現しています。

その他の性能向上とモデル選択

上記の主要なアップデートに加え、新版 Claude 3.5 Sonnet は複数のベンチマークで進歩を遂げています。TAU-bench 評価では、リテール分野でのスコアが 6.6 ポイント向上し、69.2% に達しました。Claude 3.5 Haiku は、低コストと高速性という強みを引き継いでおり、ユーザー向け製品や素早い応答が求められるシナリオに最適です。

現在、Claude 3.5 Sonnet は全ユーザーが利用可能で、開発者は Anthropic API や Amazon Bedrock などのプラットフォームからアクセスできます。今回のアップグレードは、プログラミング分野における Claude のリーダーシップを一段と強固にするとともに、AI モデルがデジタル世界を真に理解し操作する方向への重要な一歩を示しています。

Claude 3.5 Sonnet にPC操作機能が追加

コーディング能力の大幅向上と性能最適化

その他の性能向上とモデル選択

記事を検索

人気記事

ChatGPTの「使える」プロンプト（Prompt）厳選。効率を本当に10倍に上げる使い方

Claude Codeのインストールでいつもエラー？手取り足取り、たった3ステップで設定の悩みを解決

ChatGPT・Claude・Gemini・Midjourneyの出力が盛大にコケたときの切り分けチェックリストと、プロンプトKISSのコツ

ChatGPT・Claude・Gemini・Midjourneyを連動！出力のばらつきと改稿ストレスを解消する効率的ワークフロー

Spotifyのエラーコード一覧と解決ガイド