Trong sự kiện Google I/O 2026, ứng dụng Gemini đã chuyển sang hệ thống giới hạn sử dụng dựa trên khối lượng tính toán, thay thế hạn ngạch tin nhắn cố định trước đây. Tuy nhiên, quy tắc mới nhanh chóng gây ra phản ứng tiêu cực từ người dùng – các tác vụ phức tạp với nhiều tệp hoặc yêu cầu khối lượng lớn (như phân tích video, Deep Research) nhanh chóng làm cạn kiệt hạn ngạch hàng ngày. Đáp lại phản hồi này, người phụ trách Gemini Josh Woodward đã công bố nhiều điều chỉnh vào ngày 28 tháng 5, nhằm cải thiện khả năng sử dụng của mô hình Pro và tăng cường tính minh bạch về tiêu thụ.
Theo kế hoạch điều chỉnh, Google sẽ giới hạn mức hạn ngạch tối đa mà một yêu cầu (prompt) có thể tiêu thụ, ngăn chặn các tác vụ phức tạp chiếm dụng quá nhiều tài nguyên cùng lúc. Đồng thời, các yêu cầu sử dụng mô hình Gemini 3.1 Flash-Lite được phân loại là miễn phí, không còn tính vào hạn ngạch của người dùng. Woodward cũng cho biết trong tương lai sẽ cung cấp thông tin chi tiết hơn về phân bổ sử dụng và thông báo, giúp người dùng hiểu rõ hành động nào tiêu tốn hạn ngạch. Ngoài ra, các yêu cầu thất bại không được tính vào hạn ngạch, một chi tiết cũng đã được làm rõ. Hiện tại, bảng điều khiển gemini.google.com/usage chỉ hiển thị tổng quan, nhưng sau này sẽ được nâng cấp lên bảng điều khiển chi tiết hơn.

