Google lance Gemini 3.1 Flash Live pour améliorer l’expérience vocale en temps réel

Google annonce le lancement de Gemini 3.1 Flash Live, qu’il présente comme son modèle “audio et vocal de la plus haute qualité” à ce jour, et qui servira à propulser des améliorations majeures de Gemini Live et Search Live. Le modèle est proposé en version preview via l’API Gemini Live de Google AI Studio. Par rapport à 2.5 Flash Native Audio, il offre une latence plus faible et une meilleure capacité à reconnaître des détails acoustiques comme la hauteur de la voix et le débit de parole.

Dans l’usage conversationnel, Gemini 3.1 Flash Live parvient mieux à distinguer et extraire la voix utile au milieu de sons ambiants (circulation, télévision, etc.), tout en filtrant plus efficacement le bruit de fond. Google indique que Gemini Live sur Android et iOS bénéficiera de réponses plus rapides et de moins de pauses gênantes, tout en doublant la durée de conservation du contexte de la conversation, afin de soutenir des sessions de brainstorming plus longues et des relances en continu. Le système ajustera aussi dynamiquement la longueur et le ton des réponses en fonction de la situation d’échange.

Par ailleurs, Google s’appuie sur ce modèle pour déployer Search Live dans plus de 200 pays et territoires à travers le monde, en couvrant les langues et les emplacements actuellement pris en charge par AI Mode. À plus long terme, une latence plus faible et une meilleure robustesse au bruit devraient constituer un cap décisif pour faire passer l’interaction vocale de “utilisable” à “vraiment agréable à utiliser”.

Rechercher des articles

Articles Populaires

Les meilleurs prompts (instructions) pour ChatGPT : des usages qui peuvent vraiment multiplier l’efficacité par 10

L’installation de Claude Code échoue toujours ? Tutoriel pas à pas : 3 étapes pour régler les problèmes de configuration

Checklist de dépannage et astuces KISS pour éviter les ratés dans les sorties de ChatGPT, Claude, Gemini et Midjourney

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

ChatGPT和Claude总是答非所问三个提问技巧让AI秒懂你的需求