Claude 3.5這次更新最吸引人的,是把「會聊天」推進到「會操作」。在公開測試版裡,Claude 3.5可以查看螢幕內容,移動游標、點擊按鈕,並在輸入框裡打字完成步驟型任務。下面用編輯視角把Claude 3.5的新變化講清楚,方便你判斷值不值得立刻上手。
Claude 3.5新增「電腦使用」,能做什麼
所謂電腦使用,就是你給Claude 3.5一個目標,它會像人一樣依照介面流程去執行:先看螢幕,再決定點哪裡、要輸入什麼。它適合處理需要大量操作步驟的工作,例如在網頁後台逐項填寫、把資料從A頁面整理到B表單等。官方也明確表示這仍屬實驗性能力,Claude 3.5偶爾會「手滑」點錯或漏掉步驟,需要你隨時介入修正。
上線形式:API可用,支援多平台呼叫
目前Claude 3.5的電腦使用以API公開測試版形式提供,開發者可在Anthropic API上直接建置。同時,Claude 3.5也能在Amazon Bedrock與Google Cloud的Vertex AI上使用,方便企業依照既有雲端架構進行整合。對團隊而言,這代表Claude 3.5不只是展示用的噱頭,而是有機會進入流程系統、用於自動化的一類能力。

