Google Gemini 3.1 Flash Live发布：语音模型迎来最大升级

Google近日正式宣布Gemini 3.1 Flash Live，并将其称为迄今为止“最高质量的音频和语音模型”。该模型旨在为Gemini Live和Search Live提供核心升级，现已通过Google AI Studio中的Gemini Live API开放预览。

此次升级带来了多项显著改进：模型能更有效地识别音调、节奏等声学细节，并提供相比前代2.5 Flash Native Audio更低的延迟。它在区分相关语音与环境噪音（如交通或电视声）方面表现更佳，特别加强了背景噪音过滤能力。在Android和iOS的Gemini Live中，3.1 Flash Live实现了更快的响应速度，减少了对话中的尴尬停顿，并能将对话线程跟踪时间延长一倍，有助于在长时间头脑风暴中保持思维连贯。此外，Gemini Live现已能动态调整回答长度和语调以匹配实时情境。

Google同时基于此模型，在全球超过200个国家或所有AI Mode可用的语言及地区，全面推出Search Live功能。这一举措标志着Google语音交互技术的进一步普及与优化。

此次升级不仅提升了语音AI的实时性与准确性，也为更自然、流畅的人机对话体验奠定了基础，预示着智能助手在日常应用中的潜力将进一步释放。

搜索文章

热门文章

ChatGPT 最好用的几个提示词（Prompt），真正能提升 10 倍效率的用法

Claude Code安装总是报错手把手教你三步搞定配置难题

ChatGPT Claude Gemini Midjourney输出翻车的排错清单和提示词KISS技巧

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

Spotify播放错误代码汇总与解决指南