Titikey
首页实用技巧ClaudeClaude 3.5 Sonnet新功能详解:电脑操作能力与工具调用升级

Claude 3.5 Sonnet新功能详解:电脑操作能力与工具调用升级

2026/3/19
Claude

这次Claude 3.5 Sonnet最值得关注的新变化,是开始让模型“看得懂屏幕、动得了鼠标”,把自然语言指令转成真实的电脑操作流程。对需要自动化表格、网页录入、资料整理的人来说,Claude 3.5 Sonnet的可用边界被明显拉大。

Claude 3.5 Sonnet的“操作电脑能力”到底是什么

Claude 3.5 Sonnet新增了面向开发者的电脑操作相关API思路:先感知电脑界面(例如截图/界面状态),再把你的要求拆解成可执行步骤。它能按步骤完成“打开浏览器—导航到页面—定位输入框—填表—提交”这类链路,让任务不再只停留在文字建议。

这类能力的关键不在“会不会上网”,而在“会不会按界面做事”。Claude 3.5 Sonnet被设计成能在多步流程里持续做选择与纠错,适合把重复、琐碎、易出错的操作交给自动化。

更适合哪些场景:表格、后台、测试与重复流程

如果你的工作经常卡在“复制粘贴+来回切页面”,Claude 3.5 Sonnet会更有价值:从本地资料提取字段,填入在线表单或试算表;在后台系统里按固定路径录入信息;把一套流程反复跑给不同客户或不同批次数据。

对开发团队来说,Claude 3.5 Sonnet也更适合做“带工具的执行者”,例如在测试环境里按步骤点击、验证页面状态、记录结果,再把异常点回写成清单。

编程与工具使用也同步加强

除了能操作电脑,Claude 3.5 Sonnet在编程与工具使用任务上也做了强化,官方提到其在HumanEval、SWE-bench Verified等评测上有明显提升。对你最直观的影响是:Claude 3.5 Sonnet更愿意按约束输出可运行的代码、更能遵守接口格式,也更少在多步骤需求里跑偏。

如果你把Claude 3.5 Sonnet当“项目合作者”,建议把任务拆成:目标、输入、输出、不可做的事、验收标准。这样它在调用工具、生成代码、补齐边界条件时更稳定。

已知限制与使用建议:别指望一次就完美

Claude 3.5 Sonnet的电脑操作能力仍在早期阶段,滚动、拖拽、缩放等人类很自然的动作,对模型仍可能是难点。实际测试里也出现过误操作导致中断长时间任务的情况,所以重要操作建议加确认步骤与回滚策略。

想把Claude 3.5 Sonnet用得更稳,可以把“动作”写成短句清单,并要求它每执行两三步就回报当前界面状态。这样即使某一步失败,也能快速定位卡在哪个页面、哪个控件、哪个权限弹窗。

如何获取与落地:先从小流程做起

Claude 3.5 Sonnet可通过API以及云平台渠道使用,适合先从“小而固定”的流程开始,例如固定网站的表单填报、固定字段的表格更新。等你把页面结构、异常分支、权限弹窗都摸清楚,再逐步扩大到更开放的任务。

如果你要在生产环境接入Claude 3.5 Sonnet,务必把权限控制、操作白名单、敏感页面屏蔽做在外层,让Claude 3.5 Sonnet只在允许的范围内执行,从而把“能做事”变成“能安全地做事”。