這次Claude 3.5 Sonnet最值得關注的新變化,是開始讓模型「看得懂螢幕、動得了滑鼠」,把自然語言指令轉成真實的電腦操作流程。對需要自動化表格、網頁輸入、資料整理的人來說,Claude 3.5 Sonnet的可用邊界被明顯拉大。
Claude 3.5 Sonnet的「操作電腦能力」到底是什麼
Claude 3.5 Sonnet新增了面向開發者的電腦操作相關API思路:先感知電腦介面(例如截圖/介面狀態),再把你的要求拆解成可執行步驟。它能按步驟完成「打開瀏覽器—導覽到頁面—定位輸入框—填表—提交」這類鏈路,讓任務不再只停留在文字建議。
這類能力的關鍵不在「會不會上網」,而在「會不會按介面做事」。Claude 3.5 Sonnet被設計成能在多步流程裡持續做選擇與糾錯,適合把重複、瑣碎、易出錯的操作交給自動化。
更適合哪些場景:表格、後台、測試與重複流程
如果你的工作經常卡在「複製貼上+來回切頁面」,Claude 3.5 Sonnet會更有價值:從本機資料擷取欄位,填入線上表單或試算表;在後台系統裡按固定路徑輸入資訊;把一套流程反覆跑給不同客戶或不同批次資料。
對開發團隊來說,Claude 3.5 Sonnet也更適合做「帶工具的執行者」,例如在測試環境裡按步驟點擊、驗證頁面狀態、記錄結果,再把異常點回寫成清單。
程式設計與工具使用也同步加強
除了能操作電腦,Claude 3.5 Sonnet在程式設計與工具使用任務上也做了強化,官方提到其在HumanEval、SWE-bench Verified等評測上有明顯提升。對你最直觀的影響是:Claude 3.5 Sonnet更願意按約束輸出可執行的程式碼、更能遵守介面格式,也更少在多步驟需求裡跑偏。
