Google представила Gemini 3.1 Flash Live: улучшенный голосовой опыт в Gemini Live и Search Live

Google объявила о запуске Gemini 3.1 Flash Live и назвала его на сегодняшний день «самой высококачественной аудио- и голосовой моделью», которая станет основой крупных обновлений Gemini Live и Search Live. Сейчас модель доступна в Google AI Studio в формате превью через Gemini Live API. По сравнению с 2.5 Flash Native Audio она обеспечивает меньшую задержку и лучше распознаёт тонкие акустические характеристики речи — такие как высота голоса и темп.

В сложной обстановке Gemini 3.1 Flash Live лучше отделяет речь пользователя от фоновых звуков — например, шума транспорта или телевизора; в Google подчёркивают, что у модели более сильная фильтрация фонового шума. Для Gemini Live на Android и iOS новая модель означает более быстрый отклик и меньше неловких пауз. Также она позволяет вдвое увеличить длительность непрерывного отслеживания контекста диалога — до двух раз по сравнению с ранее доступным уровнем — чтобы поддерживать более долгие обсуждения и сессии мозгового штурма; кроме того, модель будет динамически подстраивать длину и тон ответа под сценарий общения.

Кроме того, Google с помощью Gemini 3.1 Flash Live выводит Search Live на глобальный рынок: сервис запускается в более чем 200 странах, охватывая все языки и регионы, где сейчас доступен AI Mode. С переходом низколатентной голосовой модели в стадию превью через API ожидается дальнейший рост стабильности и практической полезности взаимодействия в реальном времени, а также ускорение внедрения в новые приложения.

Поиск статей

Популярные Статьи

Несколько лучших подсказок (Prompt) для ChatGPT: способы использования, которые реально повышают эффективность в 10 раз

Claude Code при установке постоянно выдаёт ошибки: пошагово решаем проблему с настройкой за три шага

Чек-лист отладки и KISS‑приёмы для промптов, когда ChatGPT / Claude / Gemini / Midjourney дают сбой

Эффективный рабочий процесс связки ChatGPT + Claude + Gemini с Midjourney: решаем проблему разрозненного стиля и «краха» при правках

ChatGPT и Claude всегда отвечают невпопад: три приёма постановки вопросов, чтобы ИИ мгновенно понял ваши потребности