Claude 3.5新功能解析：电脑操控与编码能力全面升级

Anthropic近期对旗下Claude 3.5 Sonnet模型进行了全面升级，新增了操控电脑的功能，并在编码能力上再次取得突破。这次更新还包括全新推出的Claude 3.5 Haiku模型，进一步丰富了其产品线。本文将为读者解析这些值得关注的新特性。

Claude 3.5 Sonnet新增电脑操作能力

新版Claude 3.5 Sonnet最引人注目的更新是具备了操控电脑的能力。Anthropic为此构建了一个专用API，使模型能够感知计算机界面并像人类一样与之交互。开发者可以集成该API，让Claude执行诸如移动光标、点击按钮、填写表格等操作。

在OSWorld基准测试中，Claude 3.5 Sonnet在仅屏幕截图模式下取得了14.9%的得分，明显优于其他AI系统。尽管目前其电脑操作仍存在滚动或拖拽方面的挑战，但已有多家知名企业如Asana和Replit正在测试这一功能。这项能力为自动化重复性工作流程提供了全新可能。

编码能力显著提升与性能优化

新的Claude 3.5 Sonnet在编码性能上实现了质的飞跃。在SWE-bench Verified测试中，其得分从前代的33.4%提升至49.0%，超越了包括o1-preview在内的一众推理模型。早期客户反馈显示，GitLab在使用该模型进行DevSecOps任务时，推理能力提升了10%，且未增加延迟。

此外，Claude 3.5 Haiku作为最快的新一代模型，在编码任务上同样表现出色。它在SWE-bench Verified中获得了40.6%的分数，超越了许多公开可用的模型，同时保持了与上一代Haiku相同的成本和速度。这些改进让Claude在处理复杂软件工程任务时更加可靠。

其他性能提升与模型选择

除了上述核心更新外，新版Claude 3.5 Sonnet在多个基准测试中均有进步。在TAU-bench评估中，其在零售领域的得分提升了6.6个百分点，达到69.2%。Claude 3.5 Haiku则继承了低成本与高速度的优势，非常适合面向用户的产品或需要快速响应的场景。

目前Claude 3.5 Sonnet已对所有用户开放，开发者可通过Anthropic API或Amazon Bedrock等平台访问。这次升级不仅强化了Claude在编程领域的领先地位，也标志着AI模型向真正理解并操作数字世界迈出了重要一步。

Claude 3.5 Sonnet新增电脑操作能力

编码能力显著提升与性能优化

其他性能提升与模型选择

搜索文章

热门文章

ChatGPT 最好用的几个提示词（Prompt），真正能提升 10 倍效率的用法

Claude Code安装总是报错手把手教你三步搞定配置难题

ChatGPT Claude Gemini Midjourney输出翻车的排错清单和提示词KISS技巧

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

Spotify播放错误代码汇总与解决指南

Claude 3.5新功能解析：电脑操控与编码能力全面升级

Claude 3.5 Sonnet新增电脑操作能力

编码能力显著提升与性能优化

其他性能提升与模型选择

搜索文章

热门文章

ChatGPT 最好用的几个提示词（Prompt），真正能提升 10 倍效率的用法

Claude Code安装总是报错 手把手教你三步搞定配置难题

ChatGPT Claude Gemini Midjourney输出翻车的排错清单和提示词KISS技巧

ChatGPT Claude Gemini加Midjourney联动的高效工作流 解决输出不统一和改稿崩溃

Spotify播放错误代码汇总与解决指南

Claude Code安装总是报错手把手教你三步搞定配置难题

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃