Titikey
首頁實用技巧ClaudeClaude 3.5 全新功能:電腦操作與編碼能力全面進化

Claude 3.5 全新功能:電腦操作與編碼能力全面進化

2026/6/23
Claude

Anthropic 近期對 Claude 3.5 Sonnet 進行了重大更新,這不是一次小修小補,而是讓 AI 具備了直接操作電腦的能力。簡單來說,Claude 現在能看見你的螢幕,移動滑鼠,甚至打字。同時,全新的 Claude 3.5 Haiku 模型也以閃電般的速度亮相,在多項基準測試中表現搶眼。這次更新為開發者和普通用戶都打開了新的想像空間。

Claude 3.5 Sonnet 新功能:像人一樣使用電腦

這次更新的核心亮點是 Claude 3.5 Sonnet 新增的電腦操作能力。Anthropic 專門打造了一個 API,讓 Claude 能夠感知螢幕介面的像素資訊,並像人一樣與之互動。開發者可以整合這個 API,讓 Claude 執行諸如「打開瀏覽器,登入郵箱,發送郵件」這類多步驟任務。在 OSWorld 基準測試中,Claude 3.5 Sonnet 在僅憑螢幕截圖的情況下獲得了 14.9% 的得分,遠超第二名。

當然,這項功能目前還在測試階段,Claude 在滾動、拖曳等精細操作上還有待提升。例如,它可能會在長時間錄製螢幕時中斷任務。但包括 Canva、DoorDash 在內的多家公司已經開始測試這項 Claude 功能,用於自動化重複性工作流程,比如 Replit 就利用它來構建能自動檢查應用的 Agent。

編碼性能飛躍:程式設計能力行業領先

除了操作電腦,Claude 3.5 Sonnet 的編碼能力也有了質的飛躍。它在 SWE-bench Verified 測試中的得分從之前的 33.4% 提升至 49.0%,這個成績直接超越了眾多公開模型,包括一些專門的推理模型。GitLab 的測試表明,新版 Claude 在不增加延遲的情況下,為 DevSecOps 任務提供了更強的推理能力。

這意味著開發者可以更放心地將複雜的多步驟軟體開發任務交給它。在另一項評估程式設計能力的 HumanEval 測試中,Claude 3.5 Sonnet 的得分達到了 93.7%,處理實際軟體問題的能力大幅增強。對於需要頻繁與 AI 協作寫程式的用戶來說,這次的 Claude 更新確實帶來了實實在在的效率提升。

Claude 3.5 Haiku:速度與智慧的最佳平衡

與 Claude 3.5 Sonnet 一同亮相的,還有新一代快速模型 Claude 3.5 Haiku。它的最大優勢在於成本和速度,與上一代 Haiku 持平,但智慧水準卻大幅提升,甚至能與上代旗艦模型 Claude 3 Opus 相媲美。在編碼任務上,Claude 3.5 Haiku 在 SWE-bench Verified 上拿下了 40.6% 的分數,超越了包括 GPT-4 在內的許多模型。

從產品定位來看,Claude 3.5 Haiku 非常適合對延遲敏感的即時應用,比如面向用戶的產品、子代理任務,或是需要從大量資料中生成個人化體驗的服務。如果你對回應速度要求極高,又不想犧牲太多智慧水準,這款新模型會是極具性價比的選擇。

首頁商品訂單