Google Anuncia Gemini 3.1 Flash Live: ¿La Mayor Actualización de Gemini Live?

Google anunció oficialmente hoy el lanzamiento de su modelo de voz Gemini 3.1 Flash Live, al que describe como su "modelo de audio y voz de mayor calidad hasta la fecha", lo que supone una importante actualización para los servicios Gemini Live y Search Live. El modelo ya está disponible en vista previa a través de la API de Gemini Live en Google AI Studio, lo que marca un avance significativo en la tecnología de interacción por voz en tiempo real de la compañía.

En comparación con su predecesor, el 2.5 Flash Native Audio, el Gemini 3.1 Flash Live identifica de manera más eficaz los detalles acústicos como el tono y el ritmo, y reduce la latencia. Mejora notablemente la capacidad de filtrar el ruido ambiental, distinguiendo mejor la voz de los sonidos de fondo como el tráfico o la televisión. En las aplicaciones Gemini Live para Android e iOS, los usuarios obtendrán respuestas más rápidas, "reduciendo las pausas incómodas", y la duración de los hilos de conversación se duplica, garantizando la coherencia en sesiones prolongadas de lluvia de ideas. Además, Gemini Live ahora puede ajustar dinámicamente la longitud y el tono de sus respuestas para que coincidan con el contexto.

Google también está utilizando este modelo para lanzar su servicio Search Live en más de 200 países y territorios a nivel mundial, abarcando todos los idiomas y regiones donde está disponible el Modo IA, impulsando así el despliegue global de la búsqueda por voz en tiempo real. Esta actualización no solo optimiza la experiencia del usuario, sino que también demuestra el potencial de integración profunda de la IA de voz en escenarios prácticos.

El lanzamiento de Gemini 3.1 Flash Live refleja el continuo avance de Google en el rendimiento de los modelos de voz y la interacción en tiempo real. En el futuro, es probable que impulse aún más la evolución de los asistentes inteligentes hacia una dirección más natural y eficiente, acelerando la adopción generalizada de la tecnología de voz en todo el mundo.

Buscar artículos

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

Flujo de Trabajo Eficiente: Integra ChatGPT, Claude, Gemini y Midjourney para Coherencia y Menos Estrés en Revisiones

Guía completa de errores de reproducción en Spotify y cómo solucionarlos