這次主要介紹 Claude API 的幾項實用新功能:提示快取、引用與搜尋結果內容區塊,以及更細緻的工具調用控制。這些功能看似簡單,卻能顯著影響成本、延遲和可控性。下面將從「你能怎麼用」的角度快速解析清楚。
提示快取:將重複的系統提示先行儲存
如果你的 Claude API 應用場景中有大量重複的系統提示(例如統一的客服話術規則、固定的擷取格式、冗長的業務背景),提示快取會非常適合。官方說明指出,快取後重複使用可將延遲降低最高約 80%,成本降低最高約 90%,對批量任務特別友好。
實務上建議將「長期不變的部分」拆分到可快取段落,並將「每次變化的使用者輸入」單獨放在後續訊息中。這樣 Claude API 既能保持輸出一致,又不會每次為同一段冗長提示重複計費。
引用功能與搜尋結果內容區塊:讓 RAG 更易實作
Claude API 已提供引用功能,用於為回答中的關鍵資訊標註來源歸屬。在進行知識庫問答或檢索增強生成時,引用功能能減少「看起來正確但實際上缺乏證據」的尷尬情況,也方便你在前端將來源展示給使用者核對。
此外,搜尋結果內容區塊已轉為正式功能,更適合將外部檢索結果以「可引用的結構」交給模型處理。你可以讓 Claude API 在總結時附上引用標記,再由業務端決定是否強制「無引用不輸出結論」。


