这段时间 Claude 的更新更偏“开发者可落地”,不只是模型更强,还把长输出、成本可视化与长任务的上下文衔接补齐了。下面按你最容易马上用上的三类能力,快速讲清楚升级点和使用方式。
扩展输出:长文与长代码不再被 4096 卡住
在 Claude API 里,Claude Sonnet 3.5 的最大输出从 4096 提升到 8192 token,适合一次性生成更完整的技术方案、测试用例、接口文档或长段代码。启用方式是给请求加上指定的 beta 请求头(官方文档给出的示例为 anthropic-beta: max-tokens-3-5-sonnet-2024-07-15)。
实际使用建议是:把“必须一次生成完”的内容留给扩展输出,把可拆分的内容继续按章节分批生成,避免无意义的长输出拉高成本与等待时间。对于 Claude 这类擅长结构化写作的模型,长输出最直接的收益是减少反复追问的轮次。
用量与费用仪表板:终于能把 Claude 成本按 Key 跟到位
Claude 开发者控制台新增“用量”和“费用”仪表板,可以按美元金额、token 数量与 API 密钥维度追踪使用情况。对团队来说,这比单看总账单更有用:你能快速定位是哪条业务、哪个密钥在“悄悄烧钱”。
