Пишешь-пишешь — и вдруг выскакивает 429 Too Many Requests. По сути это значит: «ты слишком агрессивно шлёшь запросы». Я сам немало набил шишек, подключая API ChatGPT, Claude и Gemini; даже при генерации картинок в Midjourney встречается похожее ограничение скорости — способы ниже обычно спасают.
Сначала разберись, что именно тебе “намекает” 429
Обычно причин три: слишком высокая параллельность, слишком плотные запросы за короткое время, слишком маленькие лимиты аккаунта по квоте или скорости. У разных платформ сообщения разные, но суть одна — тебя просят сбавить темп.
Решение: пусть запросы научатся становиться в очередь
Не лезь напролом. Снизь число одновременных запросов и добавь повторные попытки с «экспоненциальной задержкой» (ждать 1 секунду, 2, 4 и т. д.). Многие при неудаче тут же отправляют заново — это как бешено колотить в дверь, и платформа тем более тебя не впускает.
Решение: объединяй вопросы — отправляй меньше запросов
Если можно пакетно — делай пакетно: объединяй несколько коротких вопросов в один запрос или сокращай контекст диалога. И Claude, и ChatGPT чувствительны к длине контекста: чем он длиннее, тем чаще становится и медленнее, и легче упирается в лимиты.


