लिखते-लिखते 429 Too Many Requests पॉप हो जाता है; साफ कहें तो मतलब है “तुम बहुत ज़्यादा ज़ोर से रिक्वेस्ट कर रहे हो।” ChatGPT, Claude, Gemini के API जोड़ते समय मैं भी कई गड्ढों में गिर चुका हूँ; Midjourney से इमेज बनाते वक्त भी इसी तरह की लिमिटिंग मिल जाती है। नीचे दिए तरीके आम तौर पर काम आकर स्थिति संभाल लेते हैं。
पहले समझो कि 429 आखिर किस बात के लिए टोक रहा है
आम कारण बस तीन हैं: concurrency बहुत ज़्यादा, कम समय में बहुत घनी रिक्वेस्ट, या अकाउंट का quota/रेट लिमिट बहुत कम। अलग-अलग प्लेटफ़ॉर्म का संदेश अलग हो सकता है, लेकिन सार यही है कि “धीरे चलो।”
समाधान: रिक्वेस्ट को कतार में लगना सिखाओ
ज़बरदस्ती मत करो। concurrency घटाओ, और हर फेल होने पर “exponential backoff” के साथ retry करो (जैसे 1 सेकंड, 2 सेकंड, 4 सेकंड इंतज़ार)। बहुत लोग फेल होते ही तुरंत दोबारा भेज देते हैं—यह दरवाज़े पर लगातार ज़ोर-ज़ोर से खटखटाने जैसा है; प्लेटफ़ॉर्म फिर और अंदर नहीं आने देता।
समाधान: सवालों को मिलाकर कम बार भेजो
जहाँ संभव हो batch में भेजो: कई छोटे सवालों को एक ही रिक्वेस्ट में जोड़ो, या बातचीत के context को संक्षिप्त करो। Claude और ChatGPT दोनों context length पर निर्भर हैं—जितना लंबा, उतना धीमा और लिमिट लगने की संभावना ज़्यादा।


