Claude 最近把“会聊天”往前推了一大步:新增公开测试版的“计算机使用”能力。简单说,你可以让 Claude 查看屏幕、移动光标、点击按钮、输入文本,像人在电脑上操作一样完成任务。本文用编辑视角把 Claude 这项新功能讲清楚:它能做什么、怎么用、适合谁。
Claude“计算机使用”到底更新了什么
这次更新的亮点,是 Claude 在 API 侧提供“计算机使用(computer use)”能力,开发者可以指挥 Claude 进行 UI 导航。Claude 会根据屏幕内容做判断,然后执行点击、输入、跳转等动作,把原本需要人手做的步骤串起来。需要提醒的是,Claude 官方也明确它仍在实验阶段,偶尔会卡顿、点错或步骤不稳定。
Claude在哪些渠道能用到这项能力
目前“计算机使用”以测试版形式在 Anthropic API 提供,方便把 Claude 接进自动化流程或内部工具。Claude 也支持在 Amazon Bedrock 与 Google Cloud Vertex AI 上构建同类能力,企业落地会更顺。与此同时,升级版 Claude 3.5 Sonnet 也已面向所有用户可用,编码表现被重点强化。
