Google a récemment annoncé officiellement le lancement du modèle Gemini 3.1 Flash Live, le qualifiant de modèle audio et vocal de la plus haute qualité à ce jour. Ce modèle constituera le cœur moteur des fonctionnalités Gemini Live et Search Live, et est désormais disponible en aperçu via l'API Gemini Live dans Google AI Studio. Cette mise à niveau est considérée comme la plus importante à ce jour pour le service Gemini Live.
Comparé à la génération précédente, Gemini 3.1 Flash Live réalise des percées sur plusieurs indicateurs clés. Le nouveau modèle identifie plus efficacement les détails vocaux tels que la hauteur tonale et le débit de parole, et réduit significativement la latence. Sa capacité de filtrage du bruit ambiant est grandement améliorée, permettant d'isoler plus précisément la voix de l'utilisateur des bruits de fond comme la circulation ou la télévision. Dans l'application mobile Gemini Live, l'expérience utilisateur s'en trouve concrètement améliorée : des réponses plus rapides, moins de pauses gênantes, et une cohérence de conversation doublée, ce qui permet aux utilisateurs de maintenir leur fil de pensée lors de longs remue-méninges. De plus, le système peut désormais ajuster dynamiquement la longueur et le ton des réponses pour s'adapter au contexte de la conversation.

