Claude 最近把“会对话”进一步推进到“会动手”:新增计算机使用(Computer Use)能力,可在屏幕上识别界面、移动光标、点击按钮并输入文字。本文用更直观的方式解释 Claude 这项新功能能做什么、适合哪些场景,以及使用前需要注意的边界。
Claude 计算机使用是什么:让模型像人一样操作界面
计算机使用是 Claude 面向开发者开放的公开测试能力,你可以用指令让 Claude 按步骤操作网页或软件界面。它的核心不是“插件”,而是让 Claude 通过“看屏幕”理解当前状态,再决定下一步“点哪里、输入什么”。官方也明确强调:该功能仍处实验阶段,偶尔会卡顿、点错或走偏,需要人为兜底。
Claude 3.5 Sonnet 升级点:更强编码与更稳的工具执行
在模型侧,Claude 3.5 Sonnet 的更新版(在部分云平台会以 Claude 3.5 Sonnet V2 命名)重点强化了软件工程与编码表现。对需要写代码、改 bug、读项目结构的用户来说,Claude 更容易按要求输出可用的实现步骤。配合计算机使用能力,Claude 能把“写方案”延伸到“照着界面把流程跑完”,但仍建议先从小任务验证稳定性。
