Google ha anunciado oficialmente el lanzamiento de su modelo Gemini 3.1 Flash Live, al que describe como su modelo de audio y voz de más alta calidad hasta la fecha. Este modelo será el núcleo que impulse las funciones Gemini Live y Search Live, y ya está disponible en vista previa a través de la API de Gemini Live en Google AI Studio. Esta actualización está considerada como la más importante hasta ahora para el servicio Gemini Live.
En comparación con la generación anterior, Gemini 3.1 Flash Live logra avances en varios indicadores clave. El nuevo modelo identifica con mayor eficacia detalles de la voz como el tono y la velocidad del habla, y reduce significativamente la latencia. Su capacidad para filtrar el ruido ambiental se ha reforzado notablemente, permitiendo separar con más precisión la voz del usuario de sonidos de fondo como el tráfico o la televisión. En la aplicación móvil de Gemini Live, la experiencia del usuario mejora tangiblemente: las respuestas son más rápidas, se reducen las pausas incómodas y la coherencia conversacional se ha duplicado, lo que facilita que los usuarios mantengan el hilo en sesiones prolongadas de lluvia de ideas. Además, el sistema ahora puede ajustar dinámicamente la longitud y el tono de sus respuestas para adaptarse al contexto de la conversación.

