Claude 3.5这次更新最吸引人的,是把“会聊天”推进到“会操作”。在公开测试版里,Claude 3.5可以查看屏幕内容,移动光标、点击按钮,并在输入框里打字完成步骤型任务。下面用编辑视角把Claude 3.5的新变化讲清楚,方便你判断值不值得立刻上手。
Claude 3.5新增“计算机使用”,能做什么
所谓计算机使用,就是你给Claude 3.5一个目标,它会像人一样按界面流程去执行:先看屏幕,再决定点哪里、输什么。它适合处理需要很多操作步骤的工作,比如在网页后台逐项填写、把资料从A页面整理到B表单等。官方也明确说这仍是实验能力,Claude 3.5偶尔会“手滑”点错或漏步骤,需要你随时纠偏。
上线形态:API可用,支持多平台调用
目前Claude 3.5的计算机使用以API公开测试版形式提供,开发者可在Anthropic API上直接构建。与此同时,Claude 3.5也能在Amazon Bedrock与Google Cloud的Vertex AI上使用,便于企业按既有云架构接入。对团队来说,这意味着Claude 3.5不只是演示玩具,而是可以进入流程系统做自动化的那一类能力。

