Claude 3.5 新機能：PC操作とコーディング性能が大幅アップ

Anthropic は最近、Claude 3.5 Sonnet に大規模なアップデートを施しました。これは単なるマイナー修正ではなく、AI が直接コンピュータを操作できる機能を実現したものです。簡単に言えば、Claude があなたの画面を見て、マウスを動かし、タイピングまで行えるようになりました。同時に、完全新作の Claude 3.5 Haiku モデルも超高速で登場し、複数のベンチマークテストで優れた結果を示しています。このアップデートにより、開発者と一般ユーザーの双方に新たな可能性が広がっています。

Claude 3.5 Sonnet の新機能：人間のようにPCを操作

今回のアップデートの中核は、Claude 3.5 Sonnet に追加されたコンピュータ操作機能です。Anthropic は専用の API を開発し、Claude が画面上のピクセル情報を認識し、人間と同じようにインタラクションできるようにしました。開発者はこの API を統合することで、「ブラウザを開いてメールにログインし、メールを送信する」といった複数ステップのタスクを Claude に実行させることが可能です。OSWorld ベンチマークでは、Claude 3.5 Sonnet がスクリーンショットのみの状態で 14.9% のスコアを獲得し、2位以下を大きく引き離しました。

ただし、この機能は現在テスト段階であり、スクロールやドラッグ＆ドロップといった細かい操作についてはまだ改善の余地があります。例えば、長時間の画面録画中にタスクが中断されることがあります。それでも、Canva や DoorDash など複数の企業がこの Claude の機能をテストし、反復作業の自動化に活用し始めています。Replit はこれを利用して、アプリを自動チェックするエージェントを構築しています。

コーディング性能の飛躍：業界トップクラスのプログラミング能力

コンピュータ操作に加え、Claude 3.5 Sonnet のコーディング能力も大きく進化しました。SWE-bench Verified テストでは、スコアが従来の 33.4% から 49.0% に向上。この結果は、専用の推論モデルを含む多くの公開モデルを直接上回るものです。GitLab のテストによると、新版 Claude はレイテンシーを増やすことなく、DevSecOps タスクに対してより強力な推論能力を提供します。

つまり、開発者は複雑なマルチステップのソフトウェア開発タスクをより安心して Claude に任せられるようになりました。別のコーディング評価テストである HumanEval では、Claude 3.5 Sonnet が 93.7% のスコアを記録し、実際のソフトウェア問題に対する処理能力が大幅に向上しています。頻繁に AI と協力してコードを書くユーザーにとって、今回の Claude アップデートは確かな生産性向上をもたらすものです。

Claude 3.5 Haiku：スピードとインテリジェンスの最適バランス

Claude 3.5 Sonnet と同時に登場したのが、次世代の高速モデル Claude 3.5 Haiku です。最大の強みはコストと速度。前世代の Haiku と同水準でありながら、インテリジェンスレベルが大幅に向上し、旧世代のフラッグシップモデル Claude 3 Opus に匹敵する性能を実現しました。コーディングタスクでは、Claude 3.5 Haiku が SWE-bench Verified で 40.6% のスコアを獲得し、GPT-4 を含む多くのモデルを上回っています。

製品ポジションとしては、Claude 3.5 Haiku はレイテンシーに敏感なリアルタイムアプリケーションに最適です。例えば、ユーザー向け製品、サブエージェントタスク、大量データからパーソナライズ体験を生成するサービスなどが挙げられます。応答速度を重視しつつ、インテリジェンスレベルを犠牲にしたくない方にとって、この新モデルはコストパフォーマンスに優れた選択肢となるでしょう。

Claude 3.5 Sonnet の新機能：人間のようにPCを操作

コーディング性能の飛躍：業界トップクラスのプログラミング能力

Claude 3.5 Haiku：スピードとインテリジェンスの最適バランス

記事を検索

人気記事

ChatGPTの「使える」プロンプト（Prompt）厳選。効率を本当に10倍に上げる使い方

Claude Codeのインストールでいつもエラー？手取り足取り、たった3ステップで設定の悩みを解決

ChatGPT・Claude・Gemini・Midjourneyの出力が盛大にコケたときの切り分けチェックリストと、プロンプトKISSのコツ

ChatGPT・Claude・Gemini・Midjourneyを連動！出力のばらつきと改稿ストレスを解消する効率的ワークフロー

Spotifyのエラーコード一覧と解決ガイド