쓰다 보면 갑자기 429 Too Many Requests가 뜨는데, 쉽게 말해 “요청을 너무 세게 넣었다”는 뜻이다. ChatGPT, Claude, Gemini API를 붙이면서 나도 꽤 많은 함정을 밟았고, Midjourney로 이미지 만들 때도 비슷한 속도 제한을 만나곤 한다. 아래 방법들은 대부분 다시 살려준다.
먼저 429가 대체 무엇을 재촉하는지부터 파악하자
흔한 원인은 세 가지다: 동시 요청이 너무 많음, 짧은 시간에 요청이 너무 밀집됨, 계정의 크레딧/쿼터 또는 속도 상한이 너무 낮음. 플랫폼마다 안내 문구는 달라도 본질은 “좀 천천히 하라”는 것이다.
해결책: 요청이 줄 서게 만들기
정면으로 맞서지 말자. 동시성(concurrency)을 낮추고, 실패한 요청마다 ‘지수 백오프(Exponential Backoff)’로 재시도하라(1초, 2초, 4초처럼). 많은 사람이 실패하자마자 즉시 재전송하는데, 그건 문 앞에서 미친 듯이 두드리는 것과 같아서 플랫폼이 더 안 들여보낸다.
해결책: 질문을 합쳐서 요청 횟수 줄이기
배치가 가능하면 배치로: 여러 개의 짧은 질문을 한 번의 요청으로 합치거나, 대화 컨텍스트를 간소화하라. Claude와 ChatGPT 모두 컨텍스트 길이에 영향을 받으며, 길수록 느려지고 제한에 걸리기 쉽다.


