Claude API 新功能解读：提示缓存、引用能力与工具调用开关

这次主要聊 Claude API 的几项实用新能力：提示缓存、引用与搜索结果内容块，以及更细的工具调用控制。它们不花哨，但能明显影响成本、延迟和可控性。下面按“你能怎么用”的角度快速拆开讲清楚。

提示缓存：把重复的系统提示先存起来

如果你的 Claude API 场景里有大量重复的系统提示（例如统一的客服话术规则、固定的抽取格式、长的业务背景），提示缓存会很合适。官方说明中，缓存后复用可将延迟降低最高约 80%，成本降低最高约 90%，对批量任务特别友好。

实践上建议把“长期不变的部分”拆到可缓存段，把“每次变化的用户输入”单独放在后续消息里。这样 Claude API 既能保持输出一致，又不会每次为同一段长提示重复计费。

Claude API 已提供引用能力，用来给回答里的关键信息做来源归属。做知识库问答或检索增强生成时，引用能减少“看起来很对但其实没证据”的尴尬，也方便你在前端把来源展示给用户核对。

另外，搜索结果内容块已转为正式能力，更适合把外部检索结果以“可引用的结构”交给模型处理。你可以让 Claude API 在总结时带上引用标记，再由业务侧决定是否强制“无引用不输出结论”。

Claude API 的 Messages 接口里，tool_choice 现在支持 none，用来明确禁止模型调用任何工具。这个开关对风控很实在：当你检测到输入包含敏感指令、或处于低信任会话阶段时，可以先用 Claude API 只做文本分析，不让它触发外部动作。

同时，文档也提到：在包含 tool_use 与 tool_result 块时，你不再必须提供 tools。对一些“回放历史工具调用记录、做审计复现”的场景，会更省事。

Claude API 还提供由官方定义的计算机使用工具，配合模型可把“怎么操作电脑”变成结构化步骤输出。它更像是把 UI 自动化流程标准化：你可以接管每一步执行与校验，减少模型直接乱点带来的风险。

落地建议是先从低风险流程试水：例如内部系统的只读查询、报表下载、表单预填。等你把失败回滚、截图校验、权限隔离做稳，再逐步扩大到更复杂的流程。