Google официально представил модель Gemini 3.1 Flash Live, назвав её «самой качественной аудио- и голосовой моделью на сегодняшний день». Эта модель обеспечит значительное улучшение функций сервисов Gemini Live и Search Live. В настоящее время разработчики могут получить предварительный доступ через Gemini Live API в Google AI Studio.
По сравнению с предыдущей версией, Gemini 3.1 Flash Live эффективнее распознаёт детали звука, такие как высота тона и темп речи, а также снижает задержку. Ключевым улучшением стала мощная фильтрация фонового шума: модель точнее выделяет речь из помех, например, шума транспорта или телевизора. В приложениях Gemini Live для Android и iOS новая модель обеспечивает более быстрый отклик, уменьшает неестественные паузы и удваивает продолжительность памяти для связности диалога, что помогает сохранять последовательность мыслей при длительных обсуждениях. Кроме того, Gemini Live теперь динамически адаптирует длину и тон ответов под контекст беседы.

