用Claude Opus4.6时,花费通常不是“问得多”,而是“上下文太长、输出太冗”。把同样的问题问得更短、更聚焦,额度消耗会明显下降。下面这套做法不需要额外工具,直接在日常对话里就能执行。
先记住一条:Claude Opus4.6主要消耗在输入与输出
Claude Opus4.6会把你发的内容、它回的内容都计入消耗,尤其是长对话反复带着历史记录。你越是把聊天当“长期备忘录”,每次发送就越贵。省钱的核心,就是减少无效的历史、减少无用的长篇输出。
提问先对齐目标:用“确认问题”替代直接长写
让Claude Opus4.6先给你一个简短方案或目录,再决定是否展开,通常比一口气让它写完更省。比如先说“给我3种思路+各自风险,每条不超过80字”,确认方向后再让它只展开其中一条。这样能避免写了一大段你根本用不上的内容。
控制上下文长度:别让旧聊天拖着新问题跑
同一个主题聊久了,Claude Opus4.6会把越来越多历史带入计算,成本会抬升。更省的方式是:阶段性总结一次,让它用10条要点压缩上下文,然后新开对话只粘贴这份摘要。需要引用旧信息时,明确指定“只用我下面贴的材料”,避免它回头翻整段记录。
附件与长文处理:先抽取再分析,别直接整篇喂
把整份PDF/长文直接丢给Claude Opus4.6,很容易造成“读了很多、用到很少”。更稳的做法是先让它告诉你需要哪几段信息(页码、标题、关键词),你再补贴对应片段。必须上传时,也可以先让Claude Opus4.6只做“关键信息抽取表”,确认字段后再做深入分析。
限制输出格式:把“长回答冲动”关掉
给Claude Opus4.6明确上限很关键,例如“最多200字”“只输出表格”“每条一句话”。如果你只需要结论,就说“先给结论+3条依据,不要过程”,通常能省下一大截输出。写代码或文案也一样,先要最小可用版本,再按需追加,不要一次性追求“完美长稿”。