एक वाक्य का सार: ChatGPT, Claude, Gemini इंटरफ़ेस पर 429 (Rate limit/Too many requests) त्रुटि आए तो आम तौर पर वजह यह नहीं होती कि “आपका कोड टूट गया”, बल्कि आपने रेट-लिमिट या कोटा नियम ट्रिगर कर दिए होते हैं; इस चेकलिस्ट के अनुसार जाँच करने पर प्रायः समस्या का स्रोत मिल जाता है।
429 असल में किस बात की चेतावनी दे रहा है
429 का मूल अर्थ है: अनुरोध बहुत घने हैं, समवर्ती (कॉनकरेंसी) बहुत अधिक है, क्रेडिट/कोटा पर्याप्त नहीं है, या आपका अकाउंट/प्रोजेक्ट प्लेटफ़ॉर्म द्वारा अस्थायी रूप से सख़्त किया गया है। यह वैसा ही है जैसे Midjourney में Discord पर लगातार पागलों की तरह प्रॉम्प्ट भेजने पर “कूलडाउन” लग जाता है—बस API में यह ज़्यादा सीधे तरीके से दिखाई देता है।
खुद आज़माई हुई काम की जाँच-सूची
1 यह साफ़ करें कि रेट-लिमिट है या बैलेंस/क्रेडिट खत्म
OpenAI/Anthropic/Google के कंसोल में आम तौर पर कोटा, बिलिंग या प्रोजेक्ट सीमाएँ दिख जाती हैं। “मुफ़्त क्रेडिट खत्म हो गया” जैसी वजह को नज़रअंदाज़ न करें—यह सबसे चुभने वाली लेकिन सबसे आम वजह होती है।
2 कॉनकरेंसी घटाएँ और बैकऑफ़ के साथ रीट्राई जोड़ें
कॉनकरेंसी कम करें, और हर विफलता पर एक्सपोनेंशियल बैकऑफ़ दें (जैसे 1s, 2s, 4s); जबरदस्ती लगातार हिट करने की तुलना में यह कहीं ज़्यादा स्थिर रहता है।
3 अनुरोधों को मिलाएँ, बेकार बातें कम भेजें
टुकड़ों में की जा रही कई कॉल्स को एक कॉल में समेटें, अर्थहीन system प्रॉम्प्ट, दोहराया हुआ कॉन्टेक्स्ट कम करें—इससे पैसे भी बचते हैं और रेट-लिमिट से टकराने की संभावना भी घटती है।


