Google объявила о запуске Gemini 3.1 Flash Live, назвав её на данный момент «моделью аудио и речи самого высокого качества». Она будет использоваться для крупных обновлений Gemini Live и Search Live. Превью-версия модели уже доступна через Gemini Live API в Google AI Studio. По сравнению с 2.5 Flash Native Audio она обеспечивает меньшую задержку и лучше распознаёт акустические детали — высоту тона, темп речи и другие параметры.
В реальных диалогах Gemini 3.1 Flash Live лучше разделяет и извлекает полезную речь на фоне звуков улицы, телевизора и других источников, а также эффективнее фильтрует фоновый шум. По словам Google, Gemini Live на Android и iOS получит более быстрые ответы и меньше неловких пауз, а время сохранения контекста диалога увеличится до вдвое большего — чтобы поддерживать более длительные сессии мозгового штурма и последовательные уточняющие вопросы. Система также будет динамически подстраивать длину и тон ответа под сценарий общения.

