Titikey
होमउपयोगी टिप्सChatGPT Claude Gemini API की 429 रेट-लिमिट त्रुटि को हल करने के 5 चरण

ChatGPT Claude Gemini API की 429 रेट-लिमिट त्रुटि को हल करने के 5 चरण

1/2/2026
实用技巧

एक वाक्य का सार: ChatGPT, Claude, Gemini इंटरफ़ेस पर 429 (Rate limit/Too many requests) त्रुटि आए तो आम तौर पर वजह यह नहीं होती कि “आपका कोड टूट गया”, बल्कि आपने रेट-लिमिट या कोटा नियम ट्रिगर कर दिए होते हैं; इस चेकलिस्ट के अनुसार जाँच करने पर प्रायः समस्या का स्रोत मिल जाता है।

429 असल में किस बात की चेतावनी दे रहा है

429 का मूल अर्थ है: अनुरोध बहुत घने हैं, समवर्ती (कॉनकरेंसी) बहुत अधिक है, क्रेडिट/कोटा पर्याप्त नहीं है, या आपका अकाउंट/प्रोजेक्ट प्लेटफ़ॉर्म द्वारा अस्थायी रूप से सख़्त किया गया है। यह वैसा ही है जैसे Midjourney में Discord पर लगातार पागलों की तरह प्रॉम्प्ट भेजने पर “कूलडाउन” लग जाता है—बस API में यह ज़्यादा सीधे तरीके से दिखाई देता है।

खुद आज़माई हुई काम की जाँच-सूची

1 यह साफ़ करें कि रेट-लिमिट है या बैलेंस/क्रेडिट खत्म

OpenAI/Anthropic/Google के कंसोल में आम तौर पर कोटा, बिलिंग या प्रोजेक्ट सीमाएँ दिख जाती हैं। “मुफ़्त क्रेडिट खत्म हो गया” जैसी वजह को नज़रअंदाज़ न करें—यह सबसे चुभने वाली लेकिन सबसे आम वजह होती है।

2 कॉनकरेंसी घटाएँ और बैकऑफ़ के साथ रीट्राई जोड़ें

कॉनकरेंसी कम करें, और हर विफलता पर एक्सपोनेंशियल बैकऑफ़ दें (जैसे 1s, 2s, 4s); जबरदस्ती लगातार हिट करने की तुलना में यह कहीं ज़्यादा स्थिर रहता है।

3 अनुरोधों को मिलाएँ, बेकार बातें कम भेजें

टुकड़ों में की जा रही कई कॉल्स को एक कॉल में समेटें, अर्थहीन system प्रॉम्प्ट, दोहराया हुआ कॉन्टेक्स्ट कम करें—इससे पैसे भी बचते हैं और रेट-लिमिट से टकराने की संभावना भी घटती है।

4 ज़्यादा स्थिर मॉडल चुनें या कोटा बढ़ाएँ

कुछ उन्नत मॉडल पर रेट-लिमिट लगने की संभावना अधिक होती है; अगर आपका बिज़नेस वॉल्यूम सच में बढ़ गया है, तो “जादुई तरीके से कोड बदलने” से बेहतर है कि ईमानदारी से अधिक कोटा के लिए आवेदन करें।

5 क्षेत्र (रीजन) और नेटवर्क एग्ज़िट की जाँच करें

Gemini और Claude क्षेत्र/नेटवर्क वातावरण के प्रति अधिक संवेदनशील हैं; एग्ज़िट अस्थिर होने पर बीच-बीच में 429 या विफल रीट्राई का तूफ़ान हो सकता है—इसलिए भरोसेमंद, स्थिर नेटवर्क नीति तय करने की सलाह है।

एक उपयोगी छोटी सलाह

मैं लॉग में साथ-साथ ये चीज़ें रिकॉर्ड करता हूँ: अनुरोध का समय, कॉनकरेंसी, टोकन उपयोग, और रिस्पॉन्स हेडर में मौजूद रेट-लिमिट फ़ील्ड (अगर हों)। इससे अगली बार 429 आए तो अंदाज़े पर निर्भर नहीं रहना पड़ता।

अगर आप एक आसान तुलना-तालिका चाहते हैं (अलग-अलग प्लेटफ़ॉर्म पर कंसोल का स्थान, आम त्रुटियों का अर्थ, रेट-लिमिट पैरामीटर कैसे सेट करें), तो Titikey पर मेरी बनाई टूल्स और ट्यूटोरियल्स की कलेक्शन देख सकते हैं—काफी ट्रायल-एंड-एरर समय बच जाएगा।

होमशॉपऑर्डर