Google объявила о запуске Gemini 3.1 Flash Live и назвала его на сегодняшний день «самой высококачественной аудио- и голосовой моделью», которая станет основой крупных обновлений Gemini Live и Search Live. Сейчас модель доступна в Google AI Studio в формате превью через Gemini Live API. По сравнению с 2.5 Flash Native Audio она обеспечивает меньшую задержку и лучше распознаёт тонкие акустические характеристики речи — такие как высота голоса и темп.
В сложной обстановке Gemini 3.1 Flash Live лучше отделяет речь пользователя от фоновых звуков — например, шума транспорта или телевизора; в Google подчёркивают, что у модели более сильная фильтрация фонового шума. Для Gemini Live на Android и iOS новая модель означает более быстрый отклик и меньше неловких пауз. Также она позволяет вдвое увеличить длительность непрерывного отслеживания контекста диалога — до двух раз по сравнению с ранее доступным уровнем — чтобы поддерживать более долгие обсуждения и сессии мозгового штурма; кроме того, модель будет динамически подстраивать длину и тон ответа под сценарий общения.

