Sau khi nhận được nhiều khiếu nại từ người dùng về việc các prompt phức tạp nhanh chóng làm cạn kiệt quota, Google đã công bố điều chỉnh khẩn cấp đối với hệ thống giới hạn sử dụng dựa trên khối lượng tính toán của ứng dụng Gemini. Tại hội nghị I/O 2026 tuần trước, công ty đã chuyển Gemini sang cơ chế đo lường mức sử dụng dựa trên độ phức tạp của prompt, mô hình được sử dụng, lời gọi công cụ và độ dài hội thoại. Tuy nhiên, một số người dùng phát hiện rằng các tác vụ phức tạp xử lý tệp lớn hoặc video có thể tiêu tốn toàn bộ quota hàng ngày chỉ trong tích tắc. Trong thông báo mới nhất, Josh Woodward, người đứng đầu Google Gemini, xác nhận rằng công ty sẽ đặt giới hạn mức tiêu thụ cho mỗi yêu cầu Gemini 3.1 Pro, giúp người dùng nhận được nhiều đầu ra hữu ích hơn từ mô hình Pro.
Các điều chỉnh cụ thể bao gồm: Prompt trên Gemini 3.1 Flash-Lite hiện hoàn toàn miễn phí, không tiêu tốn quota của người dùng; đồng thời làm rõ rằng các yêu cầu thất bại không bị tính vào mức sử dụng, "lỗi hệ thống do chúng tôi chịu trách nhiệm". Đối với các tác vụ nặng như Deep Research, Google sẽ cung cấp báo cáo phân tích mức sử dụng chi tiết hơn và thông báo theo thời gian thực, giúp người dùng lên kế hoạch sử dụng hợp lý. Hiện tại, bảng điều khiển gemini.google.com/usage chỉ hiển thị thông tin tổng quan, nhưng trong tương lai sẽ trình bày chi tiết mức tiêu thụ tính toán của từng prompt, giúp người dùng hiểu rõ tại sao các câu hỏi phức tạp lại làm cạn kiệt quota nhanh hơn.

