Компания Google официально представила модель Gemini 3.1 Flash Live, назвав её на данный момент самой совершенной аудио- и голосовой моделью. Эта модель станет основным движущим механизмом для функций Gemini Live и Search Live, а её превью уже доступно в Google AI Studio через Gemini Live API. Данное обновление считается самым значительным для сервиса Gemini Live за всё время его существования.
По сравнению с предыдущим поколением, Gemini 3.1 Flash Live демонстрирует прорыв по нескольким ключевым показателям. Новая модель эффективнее распознаёт такие детали звука, как высота тона и темп речи, а также значительно снижает задержку. Способность фильтрации фонового шума существенно усилена, что позволяет точнее выделять голос пользователя на фоне таких звуков, как шум транспорта или телевизор. В мобильном приложении Gemini Live пользователи заметят реальные улучшения: более быстрые ответы, меньше неловких пауз, а согласованность диалога выросла в два раза. Это позволяет пользователям не терять ход мыслей во время продолжительных мозговых штурмов. Кроме того, система теперь может динамически подстраивать длину и тон ответа в зависимости от контекста разговора.


