Titikey
首頁實用技巧ClaudeClaude 3.5 新功能全面解析:電腦操控與編碼能力再升級

Claude 3.5 新功能全面解析:電腦操控與編碼能力再升級

2026/6/23
Claude

Anthropic 近期對旗下 Claude 3.5 Sonnet 模型進行了全面升級,新增了操控電腦的功能,並在編碼能力上再次取得突破。這次更新還包括全新推出的 Claude 3.5 Haiku 模型,進一步豐富了其產品線。本文將為讀者解析這些值得關注的新特性。

Claude 3.5 Sonnet 新增電腦操作能力

新版 Claude 3.5 Sonnet 最引人注目的更新是具備了操控電腦的能力。Anthropic 為此建立了一個專用 API,使模型能夠感知電腦介面並像人類一樣與之互動。開發者可以整合該 API,讓 Claude 執行諸如移動游標、點擊按鈕、填寫表單等操作。

在 OSWorld 基準測試中,Claude 3.5 Sonnet 在僅螢幕截圖模式下取得了 14.9% 的得分,明顯優於其他 AI 系統。儘管目前其電腦操作仍存在滾動或拖拽方面的挑戰,但已有多家知名企業如 Asana 和 Replit 正在測試這項功能。這項能力為自動化重複性工作流程提供了全新可能。

編碼能力顯著提升與性能優化

新的 Claude 3.5 Sonnet 在編碼性能上實現了質的飛躍。在 SWE-bench Verified 測試中,其得分從前代的 33.4% 提升至 49.0%,超越了包括 o1-preview 在內的一眾推理模型。早期客戶回饋顯示,GitLab 在使用該模型進行 DevSecOps 任務時,推理能力提升了 10%,且未增加延遲。

此外,Claude 3.5 Haiku 作為最快的新一代模型,在編碼任務上同樣表現出色。它在 SWE-bench Verified 中獲得了 40.6% 的分數,超越了許多公開可用的模型,同時保持了與上一代 Haiku 相同的成本和速度。這些改進讓 Claude 在處理複雜軟體工程任務時更加可靠。

其他性能提升與模型選擇

除了上述核心更新外,新版 Claude 3.5 Sonnet 在多個基準測試中均有進步。在 TAU-bench 評估中,其在零售領域的得分提升了 6.6 個百分點,達到 69.2%。Claude 3.5 Haiku 則繼承了低成本與高速度的優勢,非常適合面向用戶的產品或需要快速回應的場景。

目前 Claude 3.5 Sonnet 已對所有用戶開放,開發者可透過 Anthropic API 或 Amazon Bedrock 等平台存取。這次升級不僅強化了 Claude 在程式設計領域的領先地位,也標誌著 AI 模型向真正理解並操作數位世界邁出了重要一步。

首頁商品訂單