В ответ на жалобы пользователей о слишком быстром расходовании новых квот вычислительных ресурсов Gemini компания Google недавно объявила о корректировке стратегии управления квотами. На Google I/O 2026 сервис Gemini перешел от фиксированного числа сообщений к лимитам на основе вычислительных ресурсов: разные по сложности задачи потребляют разное количество квот — простые текстовые запросы требуют значительно меньше ресурсов, чем сложный анализ видео или кода. Однако после обновления многие пользователи обнаружили, что при загрузке больших файлов или выполнении сложных операций бесплатный лимит расходуется за считанные минуты.
Чтобы смягчить эту проблему, руководитель Gemini Джош Вудворд сообщил, что Google внедрил максимальный лимит квоты на один запрос, который предотвращает чрезмерное потребление вычислительных ресурсов одним запросом и позволяет пользователям более эффективно использовать лимит модели Pro. Для ресурсоемких задач, таких как Deep Research, Google также запустит функцию детализированного отчета и уведомлений об использовании, помогая пользователям отслеживать расход квот в реальном времени. Сейчас панель gemini.google.com/usage предоставляет только общие данные, но в будущем появится более подробная отчетность.

