使用Claude Opus4.6時,費用通常不是因為「問得多」,而是「上下文太長、輸出太冗」。將同樣的問題問得更短、更聚焦,額度消耗會明顯下降。以下這套做法不需要額外工具,直接在日常對話中就能執行。
先記住一條:Claude Opus4.6主要消耗在輸入與輸出
Claude Opus4.6會將你發送的內容以及它回覆的內容都計入消耗,尤其是長對話中反覆攜帶歷史記錄。如果你將聊天視為「長期備忘錄」,每次發送的成本就會越高。省錢的核心在於減少無效的歷史記錄與無用的長篇輸出。
提問先對齊目標:用「確認問題」替代直接長寫
讓Claude Opus4.6先提供一個簡短方案或目錄,再決定是否展開,通常比一口氣讓它寫完更節省。例如,可以先說「給我3種思路及各自風險,每條不超過80字」,確認方向後再讓它只展開其中一條。這樣能避免產生大量你用不到的內容。
控制上下文長度:別讓舊聊天拖累新問題
同一個主題討論久了,Claude Opus4.6會將越來越多歷史記錄納入計算,導致成本上升。更節省的做法是:定期進行階段性總結,讓它用10個要點壓縮上下文,然後開啟新對話並貼上這份摘要。需要引用舊資訊時,明確指定「僅使用我下面貼上的材料」,避免它回溯整段記錄。
附件與長文處理:先抽取再分析,別直接整篇上傳
將整份PDF或長文直接丟給Claude Opus4.6,很容易造成「讀取大量內容卻只用少量」。更穩妥的做法是先讓它指出需要哪幾段資訊(例如頁碼、標題、關鍵詞),你再提供對應片段。必須上傳時,也可以先讓Claude Opus4.6只製作「關鍵資訊抽取表」,確認欄位後再進行深入分析。
限制輸出格式:關掉「長回答衝動」
給Claude Opus4.6設定明確上限非常重要,例如「最多200字」、「只輸出表格」、「每條一句話」。如果你只需要結論,可以說「先給結論加上3條依據,不要過程」,這樣通常能節省大量輸出。寫程式碼或文案時也一樣,先要求最小可用版本,再根據需要追加,不要一次性追求「完美長稿」。