Lors du Google I/O 2026, Google a annoncé le passage de l'application Gemini d'une limite de messages fixes à un nouveau système de quota basé sur la consommation de ressources de calcul. L'objectif est de réduire l'impact des requêtes textuelles simples et d'augmenter celui des tâches complexes comme les vidéos ou le codage. Cependant, après le déploiement, de nombreux utilisateurs se sont plaints d'une consommation trop rapide du quota, notamment lors du téléchargement de fichiers volumineux ou de l'exécution de tâches lourdes comme les « recherches approfondies ». En réponse, Google a réagi rapidement : Josh Woodward, responsable de Gemini, a confirmé que le système est en cours d'ajustement pour améliorer l'expérience utilisateur.
Woodward a indiqué que Google a désormais fixé un plafond par requête individuelle afin de permettre aux utilisateurs de mieux utiliser le modèle Pro. De plus, les requêtes utilisant le modèle Flash-Lite restent gratuites et ne sont pas comptabilisées dans le quota ; les échecs de requête n'affectent pas non plus le quota. Concernant la fonction de génération vidéo « Omni » qui consumait anormalement le quota, Google a corrigé le bug. Pour plus de transparence, Google prévoit de proposer une ventilation détaillée de l'utilisation et des notifications en temps réel, afin d'aider les utilisateurs à comprendre où va leur quota. Actuellement, le tableau de bord gemini.google.com/usage ne fournit qu'un aperçu général. À l'avenir, Google permettra également d'acheter des crédits IA à la demande (pay-as-you-go top-up credits).

