如果你在用 Claude API 做客服、RAG 或程式碼助手,最近的幾項更新很值得立刻跟進:更長的輸出、更清晰的引用、更省錢的提示復用,以及更好用的控制台工具。下面按「能馬上用起來」的角度,把 Claude API 新功能梳理一遍。
更長輸出:Sonnet 擴展到 8192 tokens
Claude API 已支援 Claude Sonnet 3.5 的擴展輸出能力,單次最大輸出從 4096 提升到 8192。對長文總結、程式碼生成、報告撰寫這類任務,截斷會明顯減少。
啟用方式也很直接:在呼叫 Claude API 時加上指定的 beta 請求頭即可,讓伺服器端放寬該模型的輸出上限。上線前建議先用同一組輸入對比擴展前後的結尾完整度與幻覺率,再決定預設是否開啟。
長上下文:Sonnet 提供 1M token 測試支援
Claude API 在 Claude Sonnet 4 上提供了超長上下文視窗的測試支援,並同步提高了長上下文相關的速率限制。對「整倉庫程式碼審閱」「整套合約/投標文件比對」「跨多章節知識庫問答」這類任務,長上下文會顯著減少分段拼接的工程成本。
需要注意的是,長上下文並不等於更便宜:當提示過長時計費與吞吐會更敏感。實際落地時可以把「必須進上下文的原文」與「可檢索的資料」分層,避免把所有內容一次性塞滿。
引用與搜尋結果內容塊:RAG 更像「可核對的答案」
Claude API 已提供引用能力,用於在回答中給出來源歸屬;同時,搜尋結果內容塊也已正式可用,適合搭配檢索增強生成(RAG)做「帶出處的回覆」。對合規、法務、售後知識庫這類場景,引用能減少扯皮成本:使用者能看到答案依據來自哪裡。


