谷歌近日正式宣布推出Gemini 3.1 Flash Live模型,并将其誉为迄今最高质量的音频和语音模型。该模型将为Gemini Live和Search Live功能提供核心驱动力,现已在Google AI Studio中通过Gemini Live API提供预览。此次升级被视为Gemini Live服务迄今为止最重要的一次更新。
与上一代模型相比,Gemini 3.1 Flash Live在多项关键指标上实现突破。新模型能更有效地识别音高、语速等声音细节,并显著降低延迟。其环境噪音过滤能力大幅增强,可更精准地从交通、电视等背景音中分离出用户语音。在移动端Gemini Live应用中,用户体验得到切实改善:响应速度更快,尴尬的停顿减少,并且对话连贯性提升了一倍,使得用户在长时间头脑风暴时思路不易中断。此外,系统现在能动态调整回答的长度和语气以适应对话情境。

