Titikey
होम实用技巧ClaudeClaude 3.5 新功能「电脑操作」上线:看屏幕点鼠标输入文字更像真人

Claude 3.5 新功能「电脑操作」上线:看屏幕点鼠标输入文字更像真人

8/3/2026
Claude

Claude 3.5 这次更新最吸睛的是「电脑操作」(Computer Use)能力:它不只会对话,还能看懂屏幕内容,并模拟鼠标移动、点击与键盘输入。对需要跑流程、填表、在软件里多步操作的人来说,Claude 3.5 更接近一位能动手的助理。

Claude 3.5 的「电脑操作」到底是什么

所谓 Claude 3.5 电脑操作,是让模型像人一样与桌面应用或网页界面互动:先识别屏幕上的元素,再决定移动光标、点按钮或输入文本。它并不是“直接读你的系统数据”,而是基于你提供的屏幕画面与指令来执行步骤。

官方也强调 Claude 3.5 的电脑操作仍处在公开测试阶段,偶尔会卡住、点错或步骤不稳定。把它当作能加速的“半自动操作”,会比期待一次全程无误更现实。

哪些任务会被 Claude 3.5 明显提速

当任务需要几十步重复点击时,Claude 3.5 的价值会更直观,比如:在后台系统逐条录入信息、跨页面复制粘贴、按固定规则下载/整理文件、在表单里按字段填写。只要界面元素相对清晰、流程可复用,Claude 3.5 往往能把“体力活”变成“监督活”。

对团队来说,Claude 3.5 也适合做流程验证:让它按SOP走一遍,快速暴露哪一步最容易出错、哪一页文案不清晰或按钮引导不合理。

如何用上 Claude 3.5 电脑操作(开发者视角)

目前 Claude 3.5 的电脑操作能力主要面向开发者,在 API 侧提供测试版接入,也可在 Amazon Bedrock 与 Google Cloud Vertex AI 上构建。常见做法是把“屏幕截图/界面状态”与“下一步目标”一并交给 Claude 3.5,让它输出可执行的点击与输入动作序列。

实操建议是给 Claude 3.5 明确边界:哪些页面允许操作、遇到弹窗怎么处理、关键动作前先二次确认。越是涉及付款、提交订单、删除数据等高风险步骤,越应该保留人工确认环节。

同一波更新:Claude 3.5 Sonnet 与 Haiku 也更能打

除了电脑操作,Claude 3.5 Sonnet 也被官方定位为“更强的软件工程模型”,尤其在编码与工具使用上做了强化。对于日常写代码、改Bug、读仓库的人来说,Claude 3.5 更稳定的指令遵循与推理,往往比单纯“更会聊天”更重要。

同时,Claude 3.5 Haiku 主打更快与更省,适合用在面向用户的高频场景,例如客服问答、轻量子任务、需要低延迟响应的产品功能。选型思路很简单:要深度与复杂任务选 Claude 3.5 Sonnet,要速度与规模化选 Claude 3.5 Haiku。

安全与使用提醒:别把 Claude 3.5 当成“完全自动驾驶”

Anthropic 表示这些更新经过安全评估,并与美国、英国的人工智能安全研究机构合作做部署前测试;同时认为其风险等级仍适配既有标准。即便如此,Claude 3.5 电脑操作的本质仍是“能操作界面”的能力,一旦权限给太大,就可能把小错误放大成实质损失。

更稳妥的做法是:给 Claude 3.5 最小权限、限制可访问站点与应用、保留操作日志,并对关键提交设置人工确认。这样用,Claude 3.5 才更像可靠助理,而不是不可控的自动化脚本。