Gemini 3.1 Flash Live: крупнейшее обновление голосового взаимодействия от Google

Компания Google официально представила модель Gemini 3.1 Flash Live, назвав её на данный момент самой совершенной аудио- и голосовой моделью. Эта модель станет основным движущим механизмом для функций Gemini Live и Search Live, а её превью уже доступно в Google AI Studio через Gemini Live API. Данное обновление считается самым значительным для сервиса Gemini Live за всё время его существования.

По сравнению с предыдущим поколением, Gemini 3.1 Flash Live демонстрирует прорыв по нескольким ключевым показателям. Новая модель эффективнее распознаёт такие детали звука, как высота тона и темп речи, а также значительно снижает задержку. Способность фильтрации фонового шума существенно усилена, что позволяет точнее выделять голос пользователя на фоне таких звуков, как шум транспорта или телевизор. В мобильном приложении Gemini Live пользователи заметят реальные улучшения: более быстрые ответы, меньше неловких пауз, а согласованность диалога выросла в два раза. Это позволяет пользователям не терять ход мыслей во время продолжительных мозговых штурмов. Кроме того, система теперь может динамически подстраивать длину и тон ответа в зависимости от контекста разговора.

Благодаря мощным возможностям новой модели, Google расширяет доступ к функции Search Live на более чем 200 стран и территорий по всему миру, охватывая все регионы, где уже доступен AI-режим. Это знаменует собой переход голосового взаимодействия и сервиса поиска в реальном времени от Google на новый, более точный и плавный этап.

Данное обновление сфокусировано на оптимизации базовой модели, что показывает стремление Google решить глубинные проблемы голосового ИИ в сфере работы в реальном времени, устойчивости к помехам и понимании контекста. Это закладывает прочный фундамент для более естественного и надёжного голосового взаимодействия человека и машины в будущем.

Поиск статей

Популярные Статьи

Несколько лучших подсказок (Prompt) для ChatGPT: способы использования, которые реально повышают эффективность в 10 раз

Claude Code при установке постоянно выдаёт ошибки: пошагово решаем проблему с настройкой за три шага

Чек-лист отладки и KISS‑приёмы для промптов, когда ChatGPT / Claude / Gemini / Midjourney дают сбой

Эффективный рабочий процесс связки ChatGPT + Claude + Gemini с Midjourney: решаем проблему разрозненного стиля и «краха» при правках

Сборник кодов ошибок Spotify и руководство по их устранению