Titikey
首頁实用技巧ClaudeClaude 3.5 Sonnet新功能詳解:電腦操作能力與工具呼叫升級

Claude 3.5 Sonnet新功能詳解:電腦操作能力與工具呼叫升級

2026/3/19
Claude

這次Claude 3.5 Sonnet最值得關注的新變化,是開始讓模型「看得懂螢幕、動得了滑鼠」,把自然語言指令轉成真實的電腦操作流程。對需要自動化表格、網頁輸入、資料整理的人來說,Claude 3.5 Sonnet的可用邊界被明顯拉大。

Claude 3.5 Sonnet的「操作電腦能力」到底是什麼

Claude 3.5 Sonnet新增了面向開發者的電腦操作相關API思路:先感知電腦介面(例如截圖/介面狀態),再把你的要求拆解成可執行步驟。它能按步驟完成「打開瀏覽器—導覽到頁面—定位輸入框—填表—提交」這類鏈路,讓任務不再只停留在文字建議。

這類能力的關鍵不在「會不會上網」,而在「會不會按介面做事」。Claude 3.5 Sonnet被設計成能在多步流程裡持續做選擇與糾錯,適合把重複、瑣碎、易出錯的操作交給自動化。

更適合哪些場景:表格、後台、測試與重複流程

如果你的工作經常卡在「複製貼上+來回切頁面」,Claude 3.5 Sonnet會更有價值:從本機資料擷取欄位,填入線上表單或試算表;在後台系統裡按固定路徑輸入資訊;把一套流程反覆跑給不同客戶或不同批次資料。

對開發團隊來說,Claude 3.5 Sonnet也更適合做「帶工具的執行者」,例如在測試環境裡按步驟點擊、驗證頁面狀態、記錄結果,再把異常點回寫成清單。

程式設計與工具使用也同步加強

除了能操作電腦,Claude 3.5 Sonnet在程式設計與工具使用任務上也做了強化,官方提到其在HumanEval、SWE-bench Verified等評測上有明顯提升。對你最直觀的影響是:Claude 3.5 Sonnet更願意按約束輸出可執行的程式碼、更能遵守介面格式,也更少在多步驟需求裡跑偏。

如果你把Claude 3.5 Sonnet當「專案合作者」,建議把任務拆成:目標、輸入、輸出、不可做的事、驗收標準。這樣它在呼叫工具、生成程式碼、補齊邊界條件時更穩定。

已知限制與使用建議:別指望一次就完美

Claude 3.5 Sonnet的電腦操作能力仍在早期階段,捲動、拖曳、縮放等人類很自然的動作,對模型仍可能是難點。實際測試裡也出現過誤操作導致中斷長時間任務的情況,所以重要操作建議加確認步驟與回滾策略。

想把Claude 3.5 Sonnet用得更穩,可以把「動作」寫成短句清單,並要求它每執行兩三步就回報當前介面狀態。這樣即使某一步失敗,也能快速定位卡在哪個頁面、哪個控制項、哪個權限彈窗。

如何取得與落地:先從小流程做起

Claude 3.5 Sonnet可透過API以及雲端平台管道使用,適合先從「小而固定」的流程開始,例如固定網站的表單填報、固定欄位的表格更新。等你把頁面結構、異常分支、權限彈窗都摸清楚,再逐步擴大到更開放的任務。

如果你要在生產環境接入Claude 3.5 Sonnet,務必把權限控制、操作白名單、敏感頁面遮蔽做在外層,讓Claude 3.5 Sonnet只在允許的範圍內執行,從而把「能做事」變成「能安全地做事」。