Titikey
首页实用技巧ClaudeClaude计算机使用功能上线:看屏幕点鼠标还能打字

Claude计算机使用功能上线:看屏幕点鼠标还能打字

2026/3/5
Claude

Claude 最近把“会聊天”往前推了一大步:新增公开测试版的“计算机使用”能力。简单说,你可以让 Claude 查看屏幕、移动光标、点击按钮、输入文本,像人在电脑上操作一样完成任务。本文用编辑视角把 Claude 这项新功能讲清楚:它能做什么、怎么用、适合谁。

Claude“计算机使用”到底更新了什么

这次更新的亮点,是 Claude 在 API 侧提供“计算机使用(computer use)”能力,开发者可以指挥 Claude 进行 UI 导航。Claude 会根据屏幕内容做判断,然后执行点击、输入、跳转等动作,把原本需要人手做的步骤串起来。需要提醒的是,Claude 官方也明确它仍在实验阶段,偶尔会卡顿、点错或步骤不稳定。

Claude在哪些渠道能用到这项能力

目前“计算机使用”以测试版形式在 Anthropic API 提供,方便把 Claude 接进自动化流程或内部工具。Claude 也支持在 Amazon Bedrock 与 Google Cloud Vertex AI 上构建同类能力,企业落地会更顺。与此同时,升级版 Claude 3.5 Sonnet 也已面向所有用户可用,编码表现被重点强化。

Claude适合哪些真实场景:从“几十步”变“一句话”

当任务需要很多重复操作时,Claude 的价值最直观:比如在网页后台逐项录入、在表单里批量填内容、跨页面收集信息再回填。你还可以让 Claude 按步骤跑“检查清单”,把容易漏掉的点击和输入固定成流程。已经有团队在探索让 Claude 执行数十到数百步的链式任务,用来做产品内评估、自动化验证或内部运营工具。

使用Claude计算机使用前要注意的坑与边界

因为 Claude 会“看屏幕再操作”,屏幕状态变化、弹窗遮挡、按钮样式不同,都可能让 Claude 判断失误,所以最好给它明确的步骤与容错指令。涉及账号登录、支付、隐私数据时,建议把关键步骤改为人工确认,并做好最小权限控制。安全层面,Claude 相关更新经过了与美国和英国人工智能安全研究所合作的部署前测试,Anthropic 也认为其 ASL-2 标准仍适用,但产品侧仍要自己把风控做严。