这次Claude 3.5 Sonnet最值得关注的新变化,是开始让模型“看得懂屏幕、动得了鼠标”,把自然语言指令转成真实的电脑操作流程。对需要自动化表格、网页录入、资料整理的人来说,Claude 3.5 Sonnet的可用边界被明显拉大。
Claude 3.5 Sonnet的“操作电脑能力”到底是什么
Claude 3.5 Sonnet新增了面向开发者的电脑操作相关API思路:先感知电脑界面(例如截图/界面状态),再把你的要求拆解成可执行步骤。它能按步骤完成“打开浏览器—导航到页面—定位输入框—填表—提交”这类链路,让任务不再只停留在文字建议。
这类能力的关键不在“会不会上网”,而在“会不会按界面做事”。Claude 3.5 Sonnet被设计成能在多步流程里持续做选择与纠错,适合把重复、琐碎、易出错的操作交给自动化。
更适合哪些场景:表格、后台、测试与重复流程
如果你的工作经常卡在“复制粘贴+来回切页面”,Claude 3.5 Sonnet会更有价值:从本地资料提取字段,填入在线表单或试算表;在后台系统里按固定路径录入信息;把一套流程反复跑给不同客户或不同批次数据。
对开发团队来说,Claude 3.5 Sonnet也更适合做“带工具的执行者”,例如在测试环境里按步骤点击、验证页面状态、记录结果,再把异常点回写成清单。
编程与工具使用也同步加强
除了能操作电脑,Claude 3.5 Sonnet在编程与工具使用任务上也做了强化,官方提到其在HumanEval、SWE-bench Verified等评测上有明显提升。对你最直观的影响是:Claude 3.5 Sonnet更愿意按约束输出可运行的代码、更能遵守接口格式,也更少在多步骤需求里跑偏。
