Tuần trước tại hội nghị Google I/O 2026, Google đã chuyển đổi ứng dụng Gemini từ giới hạn số tin nhắn cố định sang hệ thống quota dựa trên mức tiêu thụ tài nguyên tính toán, nhằm giúp các yêu cầu văn bản đơn giản tiêu tốn ít hơn, trong khi các tác vụ video hoặc mã hóa phức tạp tiêu tốn nhiều hơn. Tuy nhiên, sau khi cơ chế mới được triển khai, nhiều người dùng phàn nàn về việc quota bị tiêu hao quá nhanh, đặc biệt khi tải lên tệp lớn hoặc thực hiện các tác vụ nặng như "nghiên cứu sâu". Đáp lại, Google nhanh chóng phản hồi, người phụ trách Gemini, Josh Woodward, xác nhận đang điều chỉnh hệ thống để cải thiện trải nghiệm người dùng.
Woodward cho biết, Google hiện đã đặt giới hạn tối đa cho quota tiêu thụ của một yêu cầu đơn lẻ, đảm bảo người dùng có thể sử dụng mô hình Pro một cách hiệu quả hơn. Ngoài ra, các yêu cầu sử dụng mô hình Flash-Lite sẽ vẫn miễn phí và không bị tính quota; các yêu cầu thất bại cũng không ảnh hưởng đến quota. Đối với một số người dùng phản ánh về việc tính năng tạo video "Omni" tiêu thụ quota bất thường, Google đã sửa lỗi liên quan. Để tăng cường tính minh bạch, Google có kế hoạch triển khai bảng phân tích chi tiết mức sử dụng và thông báo theo thời gian thực, giúp người dùng hiểu rõ quota được dùng vào đâu. Hiện tại, bảng điều khiển gemini.google.com/usage chỉ cung cấp thông tin tổng quan. Trong tương lai, Google cũng sẽ cho phép người dùng mua tín dụng AI thanh toán theo nhu cầu (pay-as-you-go top-up credits).

