En plein milieu, ça affiche soudain « 429 Too Many Requests ». En clair : « tu envoies trop de requêtes d’un coup ». En intégrant les API de ChatGPT, Claude et Gemini, j’ai essuyé pas mal de galères ; même la génération d’images de Midjourney peut rencontrer des limitations similaires. Les méthodes ci‑dessous permettent en général de s’en sortir.
D’abord comprendre ce que 429 te reproche exactement
Les causes les plus courantes se résument à trois catégories : concurrence trop élevée, trop de requêtes dans un laps de temps trop court, ou un quota/une limite de débit du compte trop faible. Les messages varient selon les plateformes, mais l’idée est la même : ralentis.
Solution : faire apprendre à tes requêtes à faire la queue
Ne fonce pas dans le tas. Réduis le niveau de concurrence et ajoute, à chaque échec, des tentatives avec « backoff exponentiel » (attendre 1 s, puis 2 s, puis 4 s, etc.). Beaucoup de gens renvoient immédiatement dès que ça échoue ; c’est comme marteler la porte frénétiquement — la plateforme a encore moins envie de te laisser entrer.
Solution : regrouper les questions pour envoyer moins de requêtes
Quand tu peux, fais du batch : regroupe plusieurs petites questions en une seule requête, ou allège le contexte de la conversation. Claude et ChatGPT sont sensibles à la longueur du contexte : plus c’est long, plus c’est lent et plus tu risques d’être limité.


