Titikey
首页实用技巧ClaudeClaude 3.5新功能解析:电脑操控与编码能力全面升级

Claude 3.5新功能解析:电脑操控与编码能力全面升级

2026/6/23
Claude

Anthropic近期对旗下Claude 3.5 Sonnet模型进行了全面升级,新增了操控电脑的功能,并在编码能力上再次取得突破。这次更新还包括全新推出的Claude 3.5 Haiku模型,进一步丰富了其产品线。本文将为读者解析这些值得关注的新特性。

Claude 3.5 Sonnet新增电脑操作能力

新版Claude 3.5 Sonnet最引人注目的更新是具备了操控电脑的能力。Anthropic为此构建了一个专用API,使模型能够感知计算机界面并像人类一样与之交互。开发者可以集成该API,让Claude执行诸如移动光标、点击按钮、填写表格等操作。

在OSWorld基准测试中,Claude 3.5 Sonnet在仅屏幕截图模式下取得了14.9%的得分,明显优于其他AI系统。尽管目前其电脑操作仍存在滚动或拖拽方面的挑战,但已有多家知名企业如Asana和Replit正在测试这一功能。这项能力为自动化重复性工作流程提供了全新可能。

编码能力显著提升与性能优化

新的Claude 3.5 Sonnet在编码性能上实现了质的飞跃。在SWE-bench Verified测试中,其得分从前代的33.4%提升至49.0%,超越了包括o1-preview在内的一众推理模型。早期客户反馈显示,GitLab在使用该模型进行DevSecOps任务时,推理能力提升了10%,且未增加延迟。

此外,Claude 3.5 Haiku作为最快的新一代模型,在编码任务上同样表现出色。它在SWE-bench Verified中获得了40.6%的分数,超越了许多公开可用的模型,同时保持了与上一代Haiku相同的成本和速度。这些改进让Claude在处理复杂软件工程任务时更加可靠。

其他性能提升与模型选择

除了上述核心更新外,新版Claude 3.5 Sonnet在多个基准测试中均有进步。在TAU-bench评估中,其在零售领域的得分提升了6.6个百分点,达到69.2%。Claude 3.5 Haiku则继承了低成本与高速度的优势,非常适合面向用户的产品或需要快速响应的场景。

目前Claude 3.5 Sonnet已对所有用户开放,开发者可通过Anthropic API或Amazon Bedrock等平台访问。这次升级不仅强化了Claude在编程领域的领先地位,也标志着AI模型向真正理解并操作数字世界迈出了重要一步。

首页商品订单