Google发布Gemini 3.1 Flash Live升级语音体验

Google宣布推出Gemini 3.1 Flash Live，并称其为目前“最高质量的音频与语音模型”，用于驱动Gemini Live与Search Live的重大升级。该模型现已在Google AI Studio通过Gemini Live API提供预览版，相比2.5 Flash Native Audio具备更低延迟，并更擅长识别语音中的音高、语速等细微声学特征。

在复杂环境中，Gemini 3.1 Flash Live能更好地区分用户讲话与交通、电视等环境声，官方强调其背景噪声过滤能力更强。面向Android与iOS端的Gemini Live，新模型带来更快响应与更少尴尬停顿，并可将对话上下文连续跟进的时长提升至原来的两倍，以支持更长时间的讨论与头脑风暴；同时还会动态调整回答长度与语气以匹配对话场景。

此外，Google正借助Gemini 3.1 Flash Live将Search Live推向全球，在200多个国家上线，覆盖目前AI Mode可用的所有语言与地区。随着低延迟语音模型进入API预览阶段，实时语音交互的稳定性与可用性有望进一步提升，并加速更多应用落地。

搜索文章

热门文章

ChatGPT 最好用的几个提示词（Prompt），真正能提升 10 倍效率的用法

Claude Code安装总是报错手把手教你三步搞定配置难题

ChatGPT Claude Gemini Midjourney输出翻车的排错清单和提示词KISS技巧

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

ChatGPT和Claude总是答非所问三个提问技巧让AI秒懂你的需求