Claude 自主執行任務新功能：AI 操控電腦操作指南

Anthropic 近期為 Claude 3.5 Sonnet 模型帶來重磅更新，新增了直接操控電腦的自主執行任務功能。這意味著 Claude 不再是單純的對話助手，它能像人類一樣「看」螢幕並操作介面，為自動化辦公與程式開發帶來全新可能。

Claude 自主執行任務功能帶來哪些變化

這項新功能的核心在於 Anthropic 專門打造的 API，讓 Claude 能夠感知電腦介面並與之互動。開發者只需輸入指令，Claude 就能將其轉化為具體的電腦操作，例如開啟瀏覽器、填寫表單或檢查試算表。

根據官方數據，這項功能在 OSWorld 標準測試中，Claude 3.5 Sonnet 在理解螢幕截圖方面取得了 14.9% 的成績，雖然低於人類水平的 70%-75%，但已領先其他 AI 模型。執行更多步驟時，成績還能提升至 22%。

如何利用 Claude 的電腦操作提升工作效率

對於一般用戶來說，Claude 的電腦操控能力可以顯著減少繁瑣的手動操作。例如，當你需要從多個資料來源整理資訊時，只需告訴 Claude 你的需求，它就能自動開啟相關軟體、查找資訊並完成填充。

目前，包括 Replit、Canva 和 DoorDash 在內的多家公司已開始測試這項功能。Replit 甚至利用它開發了專門的應用檢查工具，在程式開發過程中自動評估程式碼表現。這種自主執行任務的能力，讓 Claude 非常適合處理重複性高、步驟多的工作流程。

Claude 新功能：更強大的編碼與多步驟任務處理

除了電腦操作能力，本次更新還大幅提升了 Claude 的編碼實力。在 SWE-bench Verified 測試中，Claude 3.5 Sonnet 的得分從 33.4% 躍升至 49%，超越了包括 OpenAI o1-preview 在內的所有公開模型。

在 TAU-bench 零售領域測試中，Claude 的得分也從 62.6% 提升到 69.2%。GitLab 和 Cognition 等企業的早期回饋顯示，新模型在長期任務和多步驟軟體開發流程中表現出色，能持續穩定運作數小時。對於開發者和需要高效處理複雜任務的用戶而言，Claude 的這次升級無疑是值得關注的。

Claude 自主執行任務功能帶來哪些變化

如何利用 Claude 的電腦操作提升工作效率

Claude 新功能：更強大的編碼與多步驟任務處理

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略

Claude 自主執行任務新功能：AI 操控電腦操作指南

Claude 自主執行任務功能帶來哪些變化

如何利用 Claude 的電腦操作提升工作效率

Claude 新功能：更強大的編碼與多步驟任務處理

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯 手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題