Google anunció hoy el lanzamiento de su modelo Gemini 3.1 Flash Live, al que se refiere como el modelo de audio y voz de "más alta calidad hasta la fecha". Este modelo aportará mejoras significativas en las funcionalidades de los servicios Gemini Live y Search Live. En la actualidad, los desarrolladores ya pueden acceder a una vista previa a través de la API de Gemini Live en Google AI Studio.
En comparación con el modelo anterior, Gemini 3.1 Flash Live es más eficaz para reconocer detalles de voz como el tono y la velocidad del habla, y reduce la latencia. Una de sus mejoras clave es una potente capacidad de filtrado de ruido de fondo, que le permite distinguir con mayor precisión la voz relevante entre ruidos ambientales como el tráfico o la televisión. En las aplicaciones Gemini Live para Android e iOS, el nuevo modelo ofrece tiempos de respuesta más rápidos, reduce las pausas poco naturales y duplica la duración de la memoria para la coherencia conversacional, lo que ayuda a mantener el hilo en sesiones de lluvia de ideas prolongadas. Además, Gemini Live ahora puede ajustar dinámicamente la longitud y el tono de sus respuestas para adaptarse al contexto de la conversación.

