Google anunció oficialmente hoy el lanzamiento de su modelo de voz Gemini 3.1 Flash Live, al que describe como su "modelo de audio y voz de mayor calidad hasta la fecha", lo que supone una importante actualización para los servicios Gemini Live y Search Live. El modelo ya está disponible en vista previa a través de la API de Gemini Live en Google AI Studio, lo que marca un avance significativo en la tecnología de interacción por voz en tiempo real de la compañía.
En comparación con su predecesor, el 2.5 Flash Native Audio, el Gemini 3.1 Flash Live identifica de manera más eficaz los detalles acústicos como el tono y el ritmo, y reduce la latencia. Mejora notablemente la capacidad de filtrar el ruido ambiental, distinguiendo mejor la voz de los sonidos de fondo como el tráfico o la televisión. En las aplicaciones Gemini Live para Android e iOS, los usuarios obtendrán respuestas más rápidas, "reduciendo las pausas incómodas", y la duración de los hilos de conversación se duplica, garantizando la coherencia en sesiones prolongadas de lluvia de ideas. Además, Gemini Live ahora puede ajustar dinámicamente la longitud y el tono de sus respuestas para que coincidan con el contexto.

