यदि आप हाल ही में Claude API का उपयोग एप्लिकेशन या एजेंट बनाने के लिए कर रहे हैं, तो सबसे स्पष्ट बदलाव कंसोल और दस्तावेज़ में दिखाई देंगे: Claude API में उपयोग और लागत डैशबोर्ड जोड़ा गया है, रिलीज़ नोट्स को अपडेट किया गया है, और साथ ही Claude API में Claude Sonnet 3.5 अब लंबा आउटपुट दे सकता है। नई सुविधाओं को डेवलपर्स की मुख्य चिंताओं — "देख पाना, लंबा लिख पाना, ट्रैक कर पाना" — के आधार पर समझाते हैं।
Claude API आउटपुट सीमा दोगुनी: लंबी सामग्री और कोड डिलीवरी बेहतर
Claude API में, Claude Sonnet 3.5 की अधिकतम आउटपुट टोकन सीमा 4096 से बढ़ाकर 8192 कर दी गई है। यह लंबे सारांश, रिपोर्ट्स, कोड जनरेशन और मल्टी-स्टेप रीजनिंग के परिणाम एक ही बार में वापस पाने के लिए उपयुक्त है। Claude API में इस विस्तारित आउटपुट को सक्षम करने के लिए, आपको अपने रिक्वेस्ट में एक विशिष्ट बीटा रिक्वेस्ट हेडर जोड़ना होगा: "anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15"।
व्यावहारिक उपयोग में, सलाह दी जाती है कि आप Claude API में इस "लंबे आउटपुट" को केवल उन्हीं परिदृश्यों के लिए रखें जहाँ इसकी वास्तव में आवश्यकता हो, जैसे: पूर्ण PRD (प्रोडक्ट रिक्वायरमेंट डॉक्यूमेंट) जनरेट करना, चलाने योग्य स्क्रिप्ट आउटपुट करना, या कमेंट्स के साथ रीफैक्टरिंग सॉल्यूशन एक बार में डिलीवर करना। केवल निष्कर्ष चाहने वाले रिक्वेस्ट के लिए, Claude API में अभी भी max_tokens को नियंत्रित करना बेहतर है, ताकि लंबे-चौड़े शब्दों पर बजट बर्बाद न हो।
Claude API कंसोल में नया उपयोग और लागत डैशबोर्ड: बिल पारदर्शी
डेवलपर कंसोल में "Usage" और "Spend" टैब जोड़े जाने के बाद, अब Claude API की खपत को डॉलर की राशि, टोकन की संख्या और API कुंजी के स्तर पर देखा जा सकता है। मल्टी-एन्वायरनमेंट, मल्टी-प्रोजेक्ट टीमों के लिए जो एक ही Claude API Key साझा करते हैं, यह असामान्य कॉल और अचानक बढ़ी लागत के स्रोत को तेज़ी से पहचानने में मदद करेगा।
इससे भी अधिक व्यावहारिक बात यह है कि आप Claude API के प्रयोगात्मक कॉल और प्रोडक्शन कॉल को अलग-अलग स्टैटिस्टिक्स में रख सकते हैं: अलग-अलग सेवाओं के लिए अलग-अलग API कुंजियाँ बनाएँ, और फिर डैशबोर्ड में टोकन कर्व और लागत कर्व की तुलना करें। इस तरह, Claude API के बजट पर चर्चा अब "अनुमान" पर नहीं, बल्कि सीधे डेटा द्वारा होगी।


