Claude 3.5 全新功能：電腦操作與編碼能力全面進化

Anthropic 近期對 Claude 3.5 Sonnet 進行了重大更新，這不是一次小修小補，而是讓 AI 具備了直接操作電腦的能力。簡單來說，Claude 現在能看見你的螢幕，移動滑鼠，甚至打字。同時，全新的 Claude 3.5 Haiku 模型也以閃電般的速度亮相，在多項基準測試中表現搶眼。這次更新為開發者和普通用戶都打開了新的想像空間。

Claude 3.5 Sonnet 新功能：像人一樣使用電腦

這次更新的核心亮點是 Claude 3.5 Sonnet 新增的電腦操作能力。Anthropic 專門打造了一個 API，讓 Claude 能夠感知螢幕介面的像素資訊，並像人一樣與之互動。開發者可以整合這個 API，讓 Claude 執行諸如「打開瀏覽器，登入郵箱，發送郵件」這類多步驟任務。在 OSWorld 基準測試中，Claude 3.5 Sonnet 在僅憑螢幕截圖的情況下獲得了 14.9% 的得分，遠超第二名。

當然，這項功能目前還在測試階段，Claude 在滾動、拖曳等精細操作上還有待提升。例如，它可能會在長時間錄製螢幕時中斷任務。但包括 Canva、DoorDash 在內的多家公司已經開始測試這項 Claude 功能，用於自動化重複性工作流程，比如 Replit 就利用它來構建能自動檢查應用的 Agent。

編碼性能飛躍：程式設計能力行業領先

除了操作電腦，Claude 3.5 Sonnet 的編碼能力也有了質的飛躍。它在 SWE-bench Verified 測試中的得分從之前的 33.4% 提升至 49.0%，這個成績直接超越了眾多公開模型，包括一些專門的推理模型。GitLab 的測試表明，新版 Claude 在不增加延遲的情況下，為 DevSecOps 任務提供了更強的推理能力。

這意味著開發者可以更放心地將複雜的多步驟軟體開發任務交給它。在另一項評估程式設計能力的 HumanEval 測試中，Claude 3.5 Sonnet 的得分達到了 93.7%，處理實際軟體問題的能力大幅增強。對於需要頻繁與 AI 協作寫程式的用戶來說，這次的 Claude 更新確實帶來了實實在在的效率提升。

Claude 3.5 Haiku：速度與智慧的最佳平衡

與 Claude 3.5 Sonnet 一同亮相的，還有新一代快速模型 Claude 3.5 Haiku。它的最大優勢在於成本和速度，與上一代 Haiku 持平，但智慧水準卻大幅提升，甚至能與上代旗艦模型 Claude 3 Opus 相媲美。在編碼任務上，Claude 3.5 Haiku 在 SWE-bench Verified 上拿下了 40.6% 的分數，超越了包括 GPT-4 在內的許多模型。

從產品定位來看，Claude 3.5 Haiku 非常適合對延遲敏感的即時應用，比如面向用戶的產品、子代理任務，或是需要從大量資料中生成個人化體驗的服務。如果你對回應速度要求極高，又不想犧牲太多智慧水準，這款新模型會是極具性價比的選擇。

Claude 3.5 Sonnet 新功能：像人一樣使用電腦

編碼性能飛躍：程式設計能力行業領先

Claude 3.5 Haiku：速度與智慧的最佳平衡

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略

Claude 3.5 全新功能：電腦操作與編碼能力全面進化

Claude 3.5 Sonnet 新功能：像人一樣使用電腦

編碼性能飛躍：程式設計能力行業領先

Claude 3.5 Haiku：速度與智慧的最佳平衡

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯 手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題