Google Gemini 3.1 Flash Live: ¿Qué ofrece la gran actualización en interacción por voz?

Google anunció hoy el lanzamiento de su modelo Gemini 3.1 Flash Live, al que se refiere como el modelo de audio y voz de "más alta calidad hasta la fecha". Este modelo aportará mejoras significativas en las funcionalidades de los servicios Gemini Live y Search Live. En la actualidad, los desarrolladores ya pueden acceder a una vista previa a través de la API de Gemini Live en Google AI Studio.

En comparación con el modelo anterior, Gemini 3.1 Flash Live es más eficaz para reconocer detalles de voz como el tono y la velocidad del habla, y reduce la latencia. Una de sus mejoras clave es una potente capacidad de filtrado de ruido de fondo, que le permite distinguir con mayor precisión la voz relevante entre ruidos ambientales como el tráfico o la televisión. En las aplicaciones Gemini Live para Android e iOS, el nuevo modelo ofrece tiempos de respuesta más rápidos, reduce las pausas poco naturales y duplica la duración de la memoria para la coherencia conversacional, lo que ayuda a mantener el hilo en sesiones de lluvia de ideas prolongadas. Además, Gemini Live ahora puede ajustar dinámicamente la longitud y el tono de sus respuestas para adaptarse al contexto de la conversación.

Con esta actualización, Google está ampliando el servicio Search Live a más de 200 países y territorios en todo el mundo, abarcando todos los idiomas y regiones donde el modo de IA ya está disponible. Este despliegue marca el compromiso de la compañía de llevar sus avanzadas capacidades de interacción por voz a un público global más amplio. Con los avances del modelo en comprensión y capacidad de respuesta en tiempo real, se espera que los asistentes de voz ofrezcan una experiencia de servicio más fiable y natural en escenarios reales con ruido.

Buscar artículos

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

Flujo de Trabajo Eficiente: Integra ChatGPT, Claude, Gemini y Midjourney para Coherencia y Menos Estrés en Revisiones

Guía completa de errores de reproducción en Spotify y cómo solucionarlos