Claude 3.5 這次最引人注目的更新,是將「對話」推進到「操作」:它可以觀看螢幕、移動游標、點擊按鈕並輸入文字。對開發者來說,Claude 3.5 不再只提供建議,而是能按步驟在介面中完成任務。
Claude 3.5「電腦使用」到底是什麼
Claude 3.5 在公開測試版中提供「電腦使用(computer use)」能力,核心是讓模型像人一樣操作電腦介面。它會基於螢幕內容做出判斷,然後執行滑鼠移動、點擊與鍵盤輸入等動作。
需要強調的是,Claude 3.5 官方將其定位為實驗功能:可用,但可能出現卡頓、步驟錯誤或點選位置不準。適合先在可控情境中測試,再逐步導入真實業務流程。
能用 Claude 3.5 做哪些「多步驟任務」
傳統自動化較像腳本,遇到介面變動就容易失效;Claude 3.5 的價值在於「看得懂當前螢幕」,因此更適合跨頁面、跨表單、步驟繁瑣的流程。例如在網站後台依要求逐項設定、在工具中完成一系列配置,或將資訊按格式輸入到系統中。
一些團隊也在探索讓 Claude 3.5 執行需數十甚至上百步的 UI 導航任務,用以輔助驗證流程、測試操作路徑或處理重複性資料登錄。
Claude 3.5 在哪些平台可用、怎麼接入
Claude 3.5 的電腦使用能力目前主要透過 API 場景開放,開發者可以在 Anthropic API 上呼叫,也可在 Amazon Bedrock 與 Google Cloud Vertex AI 上建構相關功能。若你在 AWS 端尋找模型名稱,文件中也可能出現 Claude 3.5 Sonnet V2 這類標識。
實際部署時,建議將 Claude 3.5 視為「會操作的代理」,外層加入流程控管:限制可存取的頁面範圍、為關鍵步驟添加確認點,並記錄每一步的螢幕截圖與輸入內容,以便回放與除錯。
使用 Claude 3.5 前要知道的限制與安全資訊
Claude 3.5 仍可能誤點、漏填或誤解按鈕功能,因此不應視為「無需監管的自動化」。更穩妥的做法,是讓 Claude 3.5 先在測試環境中驗證流程,再逐步開放權限,並將高風險操作(付款、刪除、提交不可逆表單)改為必須人工確認。
安全方面,Claude 3.5 的升級版本經過部署前測試,並與美國及英國的人工智慧安全研究機構合作評估;Anthropic 也表示其 ASL-2 標準仍適用於此模型。對企業或團隊來說,這些資訊更像「基礎安全說明」,實際的安全性仍取決於你賦予 Claude 3.5 的權限範圍,以及是否做好審計與回滾機制。