Gemini 3.1 Flash Live发布：语音交互迎来最大升级

谷歌近日正式宣布推出Gemini 3.1 Flash Live模型，并将其誉为迄今最高质量的音频和语音模型。该模型将为Gemini Live和Search Live功能提供核心驱动力，现已在Google AI Studio中通过Gemini Live API提供预览。此次升级被视为Gemini Live服务迄今为止最重要的一次更新。

与上一代模型相比，Gemini 3.1 Flash Live在多项关键指标上实现突破。新模型能更有效地识别音高、语速等声音细节，并显著降低延迟。其环境噪音过滤能力大幅增强，可更精准地从交通、电视等背景音中分离出用户语音。在移动端Gemini Live应用中，用户体验得到切实改善：响应速度更快，尴尬的停顿减少，并且对话连贯性提升了一倍，使得用户在长时间头脑风暴时思路不易中断。此外，系统现在能动态调整回答的长度和语气以适应对话情境。

借助新模型的强大能力，谷歌正将Search Live功能推广至全球超过200个国家和地区，覆盖所有目前已开通AI模式的地区。这标志着谷歌语音交互和实时搜索服务迈入一个更精准、更流畅的新阶段。

本次升级聚焦于底层核心模型的优化，体现出谷歌正致力于解决语音AI在实时性、抗干扰和上下文理解方面的深层挑战，这为未来更自然、更可靠的人机语音交互奠定了坚实基础。

搜索文章

热门文章

ChatGPT 最好用的几个提示词（Prompt），真正能提升 10 倍效率的用法

Claude Code安装总是报错手把手教你三步搞定配置难题

ChatGPT Claude Gemini Midjourney输出翻车的排错清单和提示词KISS技巧

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

ChatGPT和Claude总是答非所问三个提问技巧让AI秒懂你的需求