Google annonce le lancement de Gemini 3.1 Flash Live, présenté comme son “modèle audio et vocal de la plus haute qualité” à ce jour, destiné à propulser une mise à niveau majeure de Gemini Live et Search Live. Le modèle est désormais disponible en version preview dans Google AI Studio via la Gemini Live API. Par rapport à 2.5 Flash Native Audio, il offre une latence plus faible et se montre plus performant pour identifier des caractéristiques acoustiques fines dans la voix, comme la hauteur et le débit.
Dans des environnements complexes, Gemini 3.1 Flash Live parvient mieux à distinguer la parole de l’utilisateur des bruits ambiants (trafic, télévision, etc.) ; Google met en avant une meilleure filtration du bruit de fond. Sur Gemini Live pour Android et iOS, ce nouveau modèle apporte une réponse plus rapide et moins de pauses gênantes. Il permet aussi de prolonger la durée de suivi continu du contexte de conversation jusqu’à deux fois celle d’auparavant, afin de soutenir des discussions et des sessions de brainstorming plus longues ; il peut également ajuster dynamiquement la longueur et le ton des réponses selon la situation.

