यदि आप Claude API का उपयोग ग्राहक सेवा, RAG या कोड असिस्टेंट के लिए कर रहे हैं, तो हाल के कुछ अपडेट्स पर तुरंत ध्यान देना चाहिए: लंबे आउटपुट, अधिक स्पष्ट साइटेशन, लागत-बचत प्रॉम्प्ट पुन: उपयोग, और अधिक उपयोगी कंसोल टूल्स। यहाँ, "तुरंत उपयोग में लाने" के दृष्टिकोण से Claude API के नए फीचर्स का विवरण दिया गया है।
लंबा आउटपुट: Sonnet 8192 टोकन्स तक विस्तारित
Claude API अब Claude Sonnet 3.5 की विस्तारित आउटपुट क्षमता को सपोर्ट करता है, जिससे एकल आउटपुट 4096 से बढ़कर 8192 टोकन्स तक हो गया है। लंबे सारांश, कोड जनरेशन, रिपोर्ट लेखन जैसे कार्यों में कटाव कम होगा।
सक्षम करने का तरीका सीधा है: Claude API को कॉल करते समय निर्दिष्ट बीटा रिक्वेस्ट हेडर जोड़ें, जो सर्वर को इस मॉडल के आउटपुट लिमिट को बढ़ाने देता है। लाइव करने से पहले, समान इनपुट के साथ विस्तार से पहले और बाद के अंत की पूर्णता और हॉल्युसिनेशन दर की तुलना करने की सलाह दी जाती है, फिर डिफ़ॉल्ट रूप से सक्षम करने का निर्णय लें।
लंबा कॉन्टेक्स्ट: Sonnet 1M टोकन टेस्ट सपोर्ट प्रदान करता है
Claude API ने Claude Sonnet 4 पर सुपर लॉन्ग कॉन्टेक्स्ट विंडो के लिए टेस्ट सपोर्ट दिया है, और साथ ही लॉन्ग कॉन्टेक्स्ट से संबंधित रेट लिमिट भी बढ़ाई है। "पूरे रिपॉजिटरी कोड रिव्यू", "संपूर्ण कॉन्ट्रैक्ट/बिड दस्तावेज़ तुलना", "क्रॉस-चैप्टर नॉलेज बेस प्रश्नोत्तर" जैसे कार्यों के लिए, लंबा कॉन्टेक्स्ट सेगमेंटेशन और जोड़ने की इंजीनियरिंग लागत कम होगी।
ध्यान रखें, लंबा कॉन्टेक्स्ट सस्ता नहीं है: जब प्रॉम्प्ट बहुत लंबा होता है, तो चार्जिंग और थ्रूपुट अधिक संवेदनशील हो जाते हैं। व्यवहार में, "कॉन्टेक्स्ट में अवश्य शामिल करने योग्य मूल टेक्स्ट" और "खोजे जा सकने वाले सामग्री" को परतों में बाँट सकते हैं, ताकि सभी सामग्री को एक बार में भरने से बचा जा सके।
साइटेशन और सर्च रिजल्ट कंटेंट ब्लॉक्स: RAG अधिक "सत्यापन योग्य उत्तर" जैसा
Claude API ने साइटेशन क्षमता प्रदान की है, जो उत्तरों में स्रोत एट्रिब्यूशन देने के लिए है; साथ ही, सर्च रिजल्ट कंटेंट ब्लॉक्स भी आधिकारिक तौर पर उपलब्ध हैं, जो रिट्रीवल ऑगमेंटेड जनरेशन (RAG) के साथ "स्रोत सहित प्रतिक्रिया" देने के लिए उपयुक्त हैं। अनुपालन, कानूनी, बिक्री के बाद के नॉलेज बेस जैसे परिदृश्यों के लिए, साइटेशन विवाद लागत कम कर सकता है: उपयोगकर्ता देख सकते हैं कि उत्तर का आधार कहाँ से आया है।


