Titikey
首頁實用技巧ClaudeClaude 自主執行任務新功能:AI 操控電腦操作指南

Claude 自主執行任務新功能:AI 操控電腦操作指南

2026/6/28
Claude

Anthropic 近期為 Claude 3.5 Sonnet 模型帶來重磅更新,新增了直接操控電腦的自主執行任務功能。這意味著 Claude 不再是單純的對話助手,它能像人類一樣「看」螢幕並操作介面,為自動化辦公與程式開發帶來全新可能。

Claude 自主執行任務功能帶來哪些變化

這項新功能的核心在於 Anthropic 專門打造的 API,讓 Claude 能夠感知電腦介面並與之互動。開發者只需輸入指令,Claude 就能將其轉化為具體的電腦操作,例如開啟瀏覽器、填寫表單或檢查試算表。

根據官方數據,這項功能在 OSWorld 標準測試中,Claude 3.5 Sonnet 在理解螢幕截圖方面取得了 14.9% 的成績,雖然低於人類水平的 70%-75%,但已領先其他 AI 模型。執行更多步驟時,成績還能提升至 22%。

如何利用 Claude 的電腦操作提升工作效率

對於一般用戶來說,Claude 的電腦操控能力可以顯著減少繁瑣的手動操作。例如,當你需要從多個資料來源整理資訊時,只需告訴 Claude 你的需求,它就能自動開啟相關軟體、查找資訊並完成填充。

目前,包括 Replit、Canva 和 DoorDash 在內的多家公司已開始測試這項功能。Replit 甚至利用它開發了專門的應用檢查工具,在程式開發過程中自動評估程式碼表現。這種自主執行任務的能力,讓 Claude 非常適合處理重複性高、步驟多的工作流程。

Claude 新功能:更強大的編碼與多步驟任務處理

除了電腦操作能力,本次更新還大幅提升了 Claude 的編碼實力。在 SWE-bench Verified 測試中,Claude 3.5 Sonnet 的得分從 33.4% 躍升至 49%,超越了包括 OpenAI o1-preview 在內的所有公開模型。

在 TAU-bench 零售領域測試中,Claude 的得分也從 62.6% 提升到 69.2%。GitLab 和 Cognition 等企業的早期回饋顯示,新模型在長期任務和多步驟軟體開發流程中表現出色,能持續穩定運作數小時。對於開發者和需要高效處理複雜任務的用戶而言,Claude 的這次升級無疑是值得關注的。

首頁商品訂單