Suite aux nombreuses plaintes récentes d'utilisateurs concernant la consommation rapide de leur quota par les prompts complexes, Google a annoncé un ajustement d'urgence de son système de limites d'utilisation basé sur la charge de calcul dans l'application Gemini. Lors de la conférence I/O 2026 la semaine dernière, l'entreprise a fait basculer Gemini vers un nouveau mécanisme qui mesure l'utilisation en fonction de la complexité des prompts, du modèle utilisé, des appels d'outils et de la longueur des conversations. Cependant, certains utilisateurs ont constaté que les tâches complexes impliquant de gros fichiers ou des vidéos épuisaient instantanément leur quota quotidien. Josh Woodward, responsable de Gemini chez Google, a confirmé dans une mise à jour récente que l'entreprise allait plafonner la consommation par requête individuelle sur Gemini 3.1 Pro, afin de permettre aux utilisateurs d'obtenir davantage de résultats exploitables depuis le modèle Pro.
Les mesures concrètes incluent : les prompts Gemini 3.1 Flash-Lite sont désormais entièrement gratuits et ne consomment pas le quota des utilisateurs ; par ailleurs, il est clairement indiqué que les requêtes échouées ne sont pas comptabilisées, « les erreurs système sont à notre charge ». Pour les tâches lourdes comme Deep Research, Google proposera des rapports de consommation plus détaillés et des notifications en temps réel afin d'aider les utilisateurs à mieux planifier leur utilisation. Actuellement, le tableau de bord gemini.google.com/usage n'affiche qu'un aperçu général, mais à l'avenir, il présentera le détail de la charge de calcul pour chaque prompt, permettant aux utilisateurs de comprendre pourquoi une question complexe épuise plus rapidement leur quota.

