Titikey
首頁實用技巧ClaudeClaude 3.5 電腦操作功能全解析:開發者如何教AI看螢幕、點滑鼠

Claude 3.5 電腦操作功能全解析:開發者如何教AI看螢幕、點滑鼠

2026/3/11
Claude

Claude 3.5 這次更新最受矚目的,並非更擅長聊天,而是開始學會「使用電腦」。升級版 Claude 3.5 Sonnet 強化了編碼能力,同時還帶來公開測試版的電腦使用功能:能看螢幕、移動游標、點擊按鈕並輸入文字。對於從事自動化和智慧助手開發的人來說,這是一條極其實用的新途徑。

Claude 3.5 模型升級:Sonnet 更強大,Haiku 更快速

Anthropic 同步發佈了升級版 Claude 3.5 Sonnet,以及全新的 Claude 3.5 Haiku。官方強調,Claude 3.5 Sonnet 的改進是「全面的」,尤其在軟體工程與編碼任務上更為突出。

如果你更在意速度和成本,Claude 3.5 Haiku 主打低延遲與更強的指令遵循能力,定位是面向用戶產品與子代理任務。簡單理解:Claude 3.5 Sonnet 偏重「能力上限」,Claude 3.5 Haiku 偏重「響應速度與性價比」。

電腦使用功能是什麼:讓 Claude 3.5 像人類一樣操作介面

電腦使用(computer use)是 Claude 3.5 的公開測試版能力,目前主要面向 API 場景。它的核心不是呼叫某個固定工具介面,而是讓模型透過「看螢幕」的方式理解當前介面,再執行移動游標、點擊與鍵盤輸入等操作。

需要注意的是,Claude 3.5 的電腦使用仍處於實驗階段,官方也直言會「有點麻煩、容易出錯」。因此更適合做可回滾、可校驗的流程,而不是一次性不可逆的關鍵操作。

Claude 3.5 能把哪些流程自動執行起來

當任務需要幾十步甚至上百步的 UI 操作時,Claude 3.5 的電腦使用就有價值:例如在網頁後台逐項配置、在企業工具裡跨頁面填表、或在多步驟工單系統裡完成查詢與錄入。它的優勢在於「能跟著介面走」,不用你為每個頁面單獨編寫腳本。

不少團隊已經在探索類似能力,把 Claude 3.5 用在更長鏈路的工作流裡。實際落地時,建議把關鍵節點做成「確認點」,讓 Claude 3.5 每完成一段就輸出截圖/狀態摘要,便於人工或程式校驗。

上線渠道與安全資訊:別忽略部署前評估

Claude 3.5 Sonnet 的升級版已面向用戶可用,而電腦使用功能已在 API 提供公開測試,並可在 Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 上建構。你在 AWS 側可能會看到它以 Claude 3.5 Sonnet V2 的名稱出現。

安全層面,官方披露與美國、英國的 AI 安全研究機構合作做了部署前測試,並認為其 ASL-2 標準仍適用。對開發者來說,更現實的建議是:給 Claude 3.5 的電腦使用加權限邊界、操作日誌與失敗兜底,先把「能控、可查、可停」做扎實。

首頁商品訂單