Titikey
होमउपयोगी टिप्सClaudeClaude API के नए अपडेट: लंबा कॉन्टेक्स्ट, स्रोत संदर्भ और कंसोल सुधार

Claude API के नए अपडेट: लंबा कॉन्टेक्स्ट, स्रोत संदर्भ और कंसोल सुधार

13/2/2026
Claude

यदि आप Claude API का उपयोग ग्राहक सेवा, RAG या कोड असिस्टेंट के लिए कर रहे हैं, तो हाल के कुछ अपडेट्स पर तुरंत ध्यान देना चाहिए: लंबे आउटपुट, अधिक स्पष्ट साइटेशन, लागत-बचत प्रॉम्प्ट पुन: उपयोग, और अधिक उपयोगी कंसोल टूल्स। यहाँ, "तुरंत उपयोग में लाने" के दृष्टिकोण से Claude API के नए फीचर्स का विवरण दिया गया है।

लंबा आउटपुट: Sonnet 8192 टोकन्स तक विस्तारित

Claude API अब Claude Sonnet 3.5 की विस्तारित आउटपुट क्षमता को सपोर्ट करता है, जिससे एकल आउटपुट 4096 से बढ़कर 8192 टोकन्स तक हो गया है। लंबे सारांश, कोड जनरेशन, रिपोर्ट लेखन जैसे कार्यों में कटाव कम होगा।

सक्षम करने का तरीका सीधा है: Claude API को कॉल करते समय निर्दिष्ट बीटा रिक्वेस्ट हेडर जोड़ें, जो सर्वर को इस मॉडल के आउटपुट लिमिट को बढ़ाने देता है। लाइव करने से पहले, समान इनपुट के साथ विस्तार से पहले और बाद के अंत की पूर्णता और हॉल्युसिनेशन दर की तुलना करने की सलाह दी जाती है, फिर डिफ़ॉल्ट रूप से सक्षम करने का निर्णय लें।

लंबा कॉन्टेक्स्ट: Sonnet 1M टोकन टेस्ट सपोर्ट प्रदान करता है

Claude API ने Claude Sonnet 4 पर सुपर लॉन्ग कॉन्टेक्स्ट विंडो के लिए टेस्ट सपोर्ट दिया है, और साथ ही लॉन्ग कॉन्टेक्स्ट से संबंधित रेट लिमिट भी बढ़ाई है। "पूरे रिपॉजिटरी कोड रिव्यू", "संपूर्ण कॉन्ट्रैक्ट/बिड दस्तावेज़ तुलना", "क्रॉस-चैप्टर नॉलेज बेस प्रश्नोत्तर" जैसे कार्यों के लिए, लंबा कॉन्टेक्स्ट सेगमेंटेशन और जोड़ने की इंजीनियरिंग लागत कम होगी।

ध्यान रखें, लंबा कॉन्टेक्स्ट सस्ता नहीं है: जब प्रॉम्प्ट बहुत लंबा होता है, तो चार्जिंग और थ्रूपुट अधिक संवेदनशील हो जाते हैं। व्यवहार में, "कॉन्टेक्स्ट में अवश्य शामिल करने योग्य मूल टेक्स्ट" और "खोजे जा सकने वाले सामग्री" को परतों में बाँट सकते हैं, ताकि सभी सामग्री को एक बार में भरने से बचा जा सके।

साइटेशन और सर्च रिजल्ट कंटेंट ब्लॉक्स: RAG अधिक "सत्यापन योग्य उत्तर" जैसा

Claude API ने साइटेशन क्षमता प्रदान की है, जो उत्तरों में स्रोत एट्रिब्यूशन देने के लिए है; साथ ही, सर्च रिजल्ट कंटेंट ब्लॉक्स भी आधिकारिक तौर पर उपलब्ध हैं, जो रिट्रीवल ऑगमेंटेड जनरेशन (RAG) के साथ "स्रोत सहित प्रतिक्रिया" देने के लिए उपयुक्त हैं। अनुपालन, कानूनी, बिक्री के बाद के नॉलेज बेस जैसे परिदृश्यों के लिए, साइटेशन विवाद लागत कम कर सकता है: उपयोगकर्ता देख सकते हैं कि उत्तर का आधार कहाँ से आया है।

व्यवहार में, सलाह दी जाती है कि "साइटेशन प्रदर्शन प्रारूप" को सिस्टम प्रॉम्प्ट में लिखें, उदाहरण के लिए आउटपुट में बुलेट पॉइंट्स सूचीबद्ध करने और प्रत्येक के बाद संबंधित स्रोत मार्कर संलग्न करने की आवश्यकता हो, ताकि फ्रंटएंड रेंडरिंग स्थिर रहे।

अधिक लागत-बचत: प्रॉम्प्ट कैशिंग और टूल कॉल कंट्रोल अधिक लचीला

Claude API ने प्रॉम्प्ट कैशिंग (टेस्ट फीचर) प्रदान किया है, जो लंबे प्रॉम्प्ट्स को कैश और पुन: उपयोग कर सकता है, जिससे विलंबता और लागत काफी कम हो जाती है। विशिष्ट उपयोग में, बदलते नहीं ऐसे सिस्टम निर्देश, लंबी नीतियाँ, निश्चित उदाहरणों को कैश में रखें, और केवल उपयोगकर्ता के वर्तमान प्रश्न को डायनामिक भाग के रूप में भेजें।

इसके अलावा, Messages API का tool_choice अब none को सपोर्ट करता है, जो मॉडल को किसी भी टूल को कॉल न करने के लिए बाध्य कर सकता है; और tool_use/tool_result ब्लॉक्स शामिल होने पर, अब tools प्रदान करना अनिवार्य नहीं है। "शुद्ध टेक्स्ट सुरक्षित आउटपुट" या "टूल चेन स्टेज्ड एक्सिक्यूशन" वाले एप्लिकेशन्स के लिए, Claude API की नियंत्रण क्षमता अधिक है।

कंसोल अधिक उपयोगी: वर्कबेंच एवल्यूएशन और उपयोग/लागत डैशबोर्ड

Claude कंसोल वर्कबेंच में प्रॉम्प्ट जनरेटर और एवल्यूएशन मोड जोड़ा गया है: आपको केवल कार्य का वर्णन करना है, सिस्टम आपके लिए प्रॉम्प्ट ड्राफ्ट करेगा, और कई वर्जन की साइड-बाय-साइड तुलना, स्कोरिंग और चयन का सपोर्ट करेगा। उन टीमों के लिए जिन्हें तेज़ी से वार्तालाप, वर्गीकरण नियम, निष्कर्षण प्रारूप को इटरेट करने की आवश्यकता है, यह कोड में अंधाधुंध बदलाव से कहीं अधिक कुशल है।

डेवलपर कंसोल का उपयोग और लागत डैशबोर्ड भी अधिक संपूर्ण है, जो डॉलर राशि, टोकन संख्या, API key के अनुसार खर्च ट्रैक करने का सपोर्ट करता है। सलाह दी जाती है कि Claude API के बजट अलर्ट और key-स्तरीय कोटा रणनीति एक साथ लागू करें, ताकि एक गलत कॉल से बिल अचानक बढ़ने से बचा जा सके।

होमशॉपऑर्डर