Titikey
首页实用技巧ClaudeClaude 3.5计算机使用功能介绍:看屏幕点鼠标还能打字

Claude 3.5计算机使用功能介绍:看屏幕点鼠标还能打字

2026/3/20
Claude

Claude 3.5这次更新最吸引人的,是把“会聊天”推进到“会操作”。在公开测试版里,Claude 3.5可以查看屏幕内容,移动光标、点击按钮,并在输入框里打字完成步骤型任务。下面用编辑视角把Claude 3.5的新变化讲清楚,方便你判断值不值得立刻上手。

Claude 3.5新增“计算机使用”,能做什么

所谓计算机使用,就是你给Claude 3.5一个目标,它会像人一样按界面流程去执行:先看屏幕,再决定点哪里、输什么。它适合处理需要很多操作步骤的工作,比如在网页后台逐项填写、把资料从A页面整理到B表单等。官方也明确说这仍是实验能力,Claude 3.5偶尔会“手滑”点错或漏步骤,需要你随时纠偏。

上线形态:API可用,支持多平台调用

目前Claude 3.5的计算机使用以API公开测试版形式提供,开发者可在Anthropic API上直接构建。与此同时,Claude 3.5也能在Amazon Bedrock与Google Cloud的Vertex AI上使用,便于企业按既有云架构接入。对团队来说,这意味着Claude 3.5不只是演示玩具,而是可以进入流程系统做自动化的那一类能力。

模型更新点:Sonnet升级与Haiku补位

这次是升级版Claude 3.5 Sonnet(在AWS侧也会看到Sonnet V2的命名),重点强化了编码与工具使用表现,同时保持相近的成本与速度。另一条线是Claude 3.5 Haiku,主打更快的响应与更低延迟,适合面向用户的产品和拆分出来的子任务。选型上,如果你要更稳的复杂执行,优先看Claude 3.5 Sonnet;如果追求速度与吞吐,再考虑Claude 3.5 Haiku。

安全与使用建议:先从可控场景开始

Anthropic提到新版Claude 3.5在部署前做过严格安全评估,并与美国、英国的AI安全研究机构合作测试,仍适用其ASL-2标准。实际落地时,建议把Claude 3.5先放在“可回滚”的任务里,例如只读浏览、草稿录入、步骤建议,而不是直接执行高风险的支付、删库或权限变更。你把验收点插在关键步骤前,Claude 3.5的计算机使用才能既省时又不失控。