Claude這輪更新最實用的變化,是讓「看圖」、「寫程式碼」和「多步驟執行」更加流暢。對日常使用者來說,Claude不再只是回答問題,而是更像能陪伴你完成任務的助手。以下將按功能詳細拆解,你可以直接參考使用。
Claude圖像理解升級:看得懂還會「講重點」
Claude的圖像理解更偏向「讀圖做事」,而非僅描述畫面。當你提供截圖、表格照片或產品頁面給Claude,它能先抓取結構(標題、欄位、按鈕、關鍵數字),再根據你的目標輸出整理結果。
實際用法是:先讓Claude複述它識別到的關鍵資訊,再讓Claude按模板產生內容,例如「把這張收據整理成報銷表」或「從截圖裡提取表格並補齊缺失欄位」。在這類任務中,Claude的優勢是能將圖像資訊轉為可編輯的文字結構,方便後續接續流程。
Claude電腦操作能力:從建議變成「可執行步驟」(API預覽)
Anthropic為Claude 3.5 Sonnet提供了「操作電腦」的API方向:Claude能感知電腦介面,並將指令拆解為具體動作,例如開啟瀏覽器、導航頁面、在表格中輸入內容等。這項功能的意義在於,將許多「需要你點擊滑鼠」的工作,轉為Claude可代勞的步驟。
需要強調的是,這項能力目前更偏向開發者整合與測試場景,並非所有人開啟Claude就能直接遠端操控電腦。官方也提到,滾動、拖拽、縮放這類人類自然的動作,對Claude仍是挑戰,因此更適合流程清晰、步驟可驗證的自動化任務。


