Mientras escribes, de repente aparece “429 Too Many Requests”; dicho claro: “estás enviando solicitudes con demasiada fuerza”. Al integrar las APIs de ChatGPT, Claude y Gemini me he topado con bastantes problemas; incluso en la generación de imágenes de Midjourney se encuentra una limitación de velocidad similar. Los métodos de abajo suelen salvarte.
Primero aclara qué te está “apurando” el 429
Las causas comunes son tres: demasiada concurrencia, demasiadas solicitudes en poco tiempo, o que el cupo/límite de tasa de la cuenta sea demasiado bajo. Cada plataforma lo muestra distinto, pero la esencia es la misma: que vayas más despacio.
Solución: que las solicitudes aprendan a hacer cola
No lo fuerces. Reduce la concurrencia y añade reintentos con “retroceso exponencial” a cada fallo (esperar 1 s, 2 s, 4 s, etc.). Mucha gente reenvía de inmediato en cuanto falla, lo que equivale a aporrear la puerta sin parar; la plataforma tendrá aún menos ganas de dejarte entrar.
Solución: combina preguntas y envía menos veces
Si puedes agrupar, agrupa: fusiona varias preguntas cortas en una sola solicitud, o simplifica el contexto de la conversación. Tanto Claude como ChatGPT “se comen” la longitud del contexto: cuanto más largo, más fácil es que vaya más lento y te limite.


