한 줄 요약: ChatGPT, Claude, Gemini 인터페이스에서 429 오류(Rate limit/Too many requests)를 만나면, 보통 “코드가 망가진” 게 아니라 레이트 리밋이나 쿼터 규칙에 걸린 것이며, 이 체크리스트대로 점검하면 대부분 원인을 찾을 수 있다.
429는 대체 뭘 경고하는가
429의 핵심 의미는: 요청이 너무 촘촘함, 동시성이 너무 높음, 한도가 부족함, 또는 계정/프로젝트가 플랫폼에 의해 일시적으로 제한됨. Midjourney에서 Discord에 프롬프트를 미친 듯이 연속으로 보내면 “쿨다운”이 걸리는 것과 같은 이치인데, API는 더 직접적으로 나타난다.
직접 써보고 효과 좋았던 점검 체크리스트
1 제한이 속도 문제인지 잔액 부족인지 확인
OpenAI/Anthropic/Google 콘솔에서 보통 쿼터, 결제, 프로젝트 제한을 확인할 수 있다. “무료 크레딧 소진” 같은 가장 뼈아프지만 가장 흔한 원인을 놓치지 말자.
2 동시성 낮추고 백오프 재시도 추가
동시성을 낮추고, 실패 시 지수 백오프(예: 1초, 2초, 4초)를 적용하면 무작정 들이받는 것보다 훨씬 안정적이다.
3 요청을 합치고 쓸데없는 말 줄이기
조각난 여러 번의 호출을 한 번으로 합치고, 의미 없는 system 프롬프트나 중복 컨텍스트를 줄이면 비용도 아끼고 레이트 리밋에 걸릴 확률도 낮아진다.


