Google a officiellement annoncé aujourd'hui le lancement du modèle vocal Gemini 3.1 Flash Live, présenté comme "son modèle audio et vocal de la plus haute qualité à ce jour", apportant des améliorations significatives aux services Gemini Live et Search Live. Ce modèle est actuellement disponible en aperçu dans Google AI Studio via l'API Gemini Live, ce qui représente une avancée importante pour Google dans les technologies d'interaction vocale en temps réel.
Comparé à la génération précédente 2.5 Flash Native Audio, Gemini 3.1 Flash Live identifie plus efficacement les détails acoustiques comme la hauteur et le rythme, tout en réduisant la latence. Il améliore notablement la filtration du bruit ambiant, distinguant mieux la parole des sons de fond tels que la circulation ou la télévision. Dans les applications Gemini Live sur Android et iOS, les utilisateurs obtiendront des réponses plus rapides, "réduisant les pauses gênantes", et la durée des fils de conversation est doublée, assurant une continuité de pensée lors de longs brainstormings. De plus, Gemini Live peut désormais ajuster dynamiquement la longueur et le ton des réponses pour s'adapter au contexte.

