這次 Claude 更新的看點相當集中:Claude 4 系列引入了「即時回覆 + 擴展思考」的混合模式,同時補齊了智能體長任務能力、開發者 API 與成本優化。對於撰寫程式碼、執行工作流程或進行長期專案的使用者來說,體驗上的變化比單純更換模型更為明顯。以下將依功能逐一解析 Claude 的新變革。
Claude 4 系列模型升級:更強的編程能力與更穩定的推理節奏
Claude 4 包含 Claude Opus 4 和 Claude Sonnet 4,兩者皆支援擴展思考(extended thinking),適合需要多步推理、反覆權衡的任務。官方在 SWE-bench Verified 上公布的數據顯示:開啟擴展思考後,Claude Opus 4 達成 79.4%,Claude Sonnet 4 則為 80.2%。若日常從事程式碼修復、重構或需求拆解,這類「高上下文 + 長鏈路」的任務將更能從中受益。
智能體能力躍升:可連續運行數小時與並行工具呼叫
Claude 4 的一項實際改進是更能「長時間運作」:官方展示中最高可獨立運行達 7 小時,並透過待辦事項列表維持任務線索,不易偏離主題。同時,Claude 4 系列支援並行處理多種工具;當應用程式授予本地檔案權限時,Claude 還能於對話間保留記憶並逐步累積資訊。對於需要自動化執行流程的團隊而言,這比單輪對話更為關鍵。


