Google annonce le lancement de Gemini 3.1 Flash Live, qu’il présente comme son modèle “audio et vocal de la plus haute qualité” à ce jour, et qui servira à propulser des améliorations majeures de Gemini Live et Search Live. Le modèle est proposé en version preview via l’API Gemini Live de Google AI Studio. Par rapport à 2.5 Flash Native Audio, il offre une latence plus faible et une meilleure capacité à reconnaître des détails acoustiques comme la hauteur de la voix et le débit de parole.
Dans l’usage conversationnel, Gemini 3.1 Flash Live parvient mieux à distinguer et extraire la voix utile au milieu de sons ambiants (circulation, télévision, etc.), tout en filtrant plus efficacement le bruit de fond. Google indique que Gemini Live sur Android et iOS bénéficiera de réponses plus rapides et de moins de pauses gênantes, tout en doublant la durée de conservation du contexte de la conversation, afin de soutenir des sessions de brainstorming plus longues et des relances en continu. Le système ajustera aussi dynamiquement la longueur et le ton des réponses en fonction de la situation d’échange.

