在回应近期用户关于复杂提示迅速消耗配额的广泛投诉后,Google宣布对Gemini应用基于计算量的用量限制系统进行紧急调整。上周的I/O 2026大会上,该公司将Gemini切换至根据提示复杂程度、所用模型、工具调用及聊天长度来计量使用量的新机制,然而部分用户发现处理大型文件或视频的复杂任务会瞬间耗尽其每日配额。Google Gemini负责人Josh Woodward在最新说明中确认,公司将对单个Gemini 3.1 Pro请求的消耗设置上限,从而让用户从Pro模型中获得更多有效输出。
具体调整措施包括:Gemini 3.1 Flash-Lite提示现已完全免费,不占用用户配额;同时明确失败请求不计入用量,“系统失误由我们承担”。针对Deep Research等重度任务,Google将提供更为详细的用量分解报告和实时通知,帮助用户合理规划使用。当前gemini.google.com/usage面板仅显示概览信息,未来将呈现每个提示的计算消耗明细,使用户能够清晰了解复杂提问为何更快耗尽额度。

