Resumen en una frase: si te aparece el error 429 (Rate limit/Too many requests) en las interfaces de ChatGPT, Claude o Gemini, normalmente no es que “tu código se haya roto”, sino que activaste reglas de limitación de tasa o de cuota; siguiendo esta lista de verificación casi siempre podrás localizar la causa.
¿Qué está indicando realmente el 429?
El significado clave del 429 es: demasiadas solicitudes, demasiada concurrencia, cuota insuficiente, o que tu cuenta/proyecto ha sido restringido temporalmente por la plataforma. Es el mismo principio que cuando en Discord, con Midjourney, envías prompts frenéticamente y te ponen en “enfriamiento”, solo que en la API se manifiesta de forma más directa.
Lista de verificación probada y útil
1. Aclara si es limitación de velocidad o falta de saldo
En las consolas de OpenAI/Anthropic/Google normalmente puedes ver cuotas, facturación o restricciones del proyecto. No pases por alto la razón más dolorosa pero más común: “se agotó el crédito gratuito”.
2. Reduce la concurrencia y añade reintentos con backoff
Baja la concurrencia y aplica backoff exponencial a cada fallo (por ejemplo 1 s, 2 s, 4 s); es mucho más estable que insistir a la fuerza.
3. Combina solicitudes y elimina relleno
Convierte múltiples llamadas fragmentadas en una sola; reduce system prompts innecesarios y contexto repetido: ahorra dinero y disminuye la probabilidad de chocar con el rate limit.


