Claude 3.5 新功能全面解析：電腦操控與編碼能力再升級

Anthropic 近期對旗下 Claude 3.5 Sonnet 模型進行了全面升級，新增了操控電腦的功能，並在編碼能力上再次取得突破。這次更新還包括全新推出的 Claude 3.5 Haiku 模型，進一步豐富了其產品線。本文將為讀者解析這些值得關注的新特性。

Claude 3.5 Sonnet 新增電腦操作能力

新版 Claude 3.5 Sonnet 最引人注目的更新是具備了操控電腦的能力。Anthropic 為此建立了一個專用 API，使模型能夠感知電腦介面並像人類一樣與之互動。開發者可以整合該 API，讓 Claude 執行諸如移動游標、點擊按鈕、填寫表單等操作。

在 OSWorld 基準測試中，Claude 3.5 Sonnet 在僅螢幕截圖模式下取得了 14.9% 的得分，明顯優於其他 AI 系統。儘管目前其電腦操作仍存在滾動或拖拽方面的挑戰，但已有多家知名企業如 Asana 和 Replit 正在測試這項功能。這項能力為自動化重複性工作流程提供了全新可能。

編碼能力顯著提升與性能優化

新的 Claude 3.5 Sonnet 在編碼性能上實現了質的飛躍。在 SWE-bench Verified 測試中，其得分從前代的 33.4% 提升至 49.0%，超越了包括 o1-preview 在內的一眾推理模型。早期客戶回饋顯示，GitLab 在使用該模型進行 DevSecOps 任務時，推理能力提升了 10%，且未增加延遲。

此外，Claude 3.5 Haiku 作為最快的新一代模型，在編碼任務上同樣表現出色。它在 SWE-bench Verified 中獲得了 40.6% 的分數，超越了許多公開可用的模型，同時保持了與上一代 Haiku 相同的成本和速度。這些改進讓 Claude 在處理複雜軟體工程任務時更加可靠。

其他性能提升與模型選擇

除了上述核心更新外，新版 Claude 3.5 Sonnet 在多個基準測試中均有進步。在 TAU-bench 評估中，其在零售領域的得分提升了 6.6 個百分點，達到 69.2%。Claude 3.5 Haiku 則繼承了低成本與高速度的優勢，非常適合面向用戶的產品或需要快速回應的場景。

目前 Claude 3.5 Sonnet 已對所有用戶開放，開發者可透過 Anthropic API 或 Amazon Bedrock 等平台存取。這次升級不僅強化了 Claude 在程式設計領域的領先地位，也標誌著 AI 模型向真正理解並操作數位世界邁出了重要一步。

Claude 3.5 Sonnet 新增電腦操作能力

編碼能力顯著提升與性能優化

其他性能提升與模型選擇

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略

Claude 3.5 新功能全面解析：電腦操控與編碼能力再升級

Claude 3.5 Sonnet 新增電腦操作能力

編碼能力顯著提升與性能優化

其他性能提升與模型選擇

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯 手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題