Tóm tắt nhanh: Khi gặp lỗi API 429 (Rate limit/Too many requests) từ ChatGPT, Claude hay Gemini, thường không phải do "code của bạn có vấn đề", mà là do bạn đã chạm đến giới hạn tốc độ hoặc quy tắc hạn ngạch. Làm theo danh sách kiểm tra này hầu như luôn giúp xác định được nguyên nhân.
Lỗi 429 Thực Sự Cảnh Báo Điều Gì?
Ý nghĩa cốt lõi của lỗi 429 là: yêu cầu quá dày, số lượng đồng thời (concurrency) quá cao, hạn ngạch không đủ, hoặc tài khoản/dự án của bạn bị nền tảng tạm thời siết chặt. Nó giống như việc bạn gửi liên tục lệnh (prompt) cho Midjourney trong Discord và bị "làm mát" (cool down), chỉ có cách API thể hiện điều đó trực tiếp hơn.
Danh Sách Kiểm Tra Đã Được Thử Nghiệm
1. Xác Định Rõ: Giới Hạn Tốc Độ Hay Hết Số Dư?
Bảng điều khiển (console) của OpenAI, Anthropic hoặc Google thường hiển thị hạn ngạch (quota), hóa đơn hoặc giới hạn dự án. Đừng bỏ qua nguyên nhân phổ biến nhất nhưng cũng "đau lòng" nhất: hạn ngạch miễn phí đã được sử dụng hết.
2. Giảm Số Lượng Đồng Thời Và Thêm Cơ Chế Thử Lại Có Độ Trễ (Backoff Retry)
Việc giảm số lượng yêu cầu đồng thời và thêm cơ chế thử lại với độ trễ tăng theo cấp số nhân (ví dụ: 1s, 2s, 4s) sẽ ổn định hơn rất nhiều so với việc cứ "cố đấm ăn xôi".
3. Gộp Các Yêu Cầu Và Giảm Nội Dung Không Cần Thiết
Hãy gộp nhiều lần gọi API rời rạc thành một lần duy nhất, giảm các lệnh hệ thống (system prompt) vô nghĩa hoặc ngữ cảnh lặp lại. Điều này vừa tiết kiệm chi phí vừa giảm khả năng chạm giới hạn.


