Краткое резюме в одном предложении: если при вызове API ChatGPT, Claude или Gemini вы получаете ошибку 429 (Rate limit/Too many requests), обычно это не значит, что «код сломался», а что сработали ограничения по скорости или квотам; пройдитесь по этому чек-листу — почти всегда удаётся найти причину.
О чём на самом деле предупреждает 429
Суть 429 в том, что запросы слишком частые, параллелизм слишком высокий, не хватает лимита/квоты, либо вашу учётную запись/проект платформа временно «поджала». Это как с Midjourney в Discord: если без остановки спамить промптами, вас ставят на «кулдаун», просто в API это проявляется более прямолинейно.
Проверенный на практике чек-лист
1 Разберитесь, это ограничение скорости или закончились средства
В консолях OpenAI/Anthropic/Google обычно можно увидеть квоты, биллинг или ограничения проекта. Не игнорируйте вариант «закончился бесплатный лимит» — самый обидный, но самый частый.
2 Снизьте параллелизм и добавьте повтор с backoff
Уменьшите количество параллельных запросов, а для каждого сбоя сделайте экспоненциальную задержку (например, 1с, 2с, 4с) — это намного стабильнее, чем упорно «продавливаться».
3 Объединяйте запросы и меньше шлите лишнего
Склейте дробные многократные вызовы в один, сократите бессмысленные system-подсказки и повторяющийся контекст — так и дешевле, и вероятность упереться в лимит ниже.


