Google宣布推出Gemini 3.1 Flash Live,并称其为目前“最高质量的音频与语音模型”,用于驱动Gemini Live与Search Live的重大升级。该模型现已在Google AI Studio通过Gemini Live API提供预览版,相比2.5 Flash Native Audio具备更低延迟,并更擅长识别语音中的音高、语速等细微声学特征。
在复杂环境中,Gemini 3.1 Flash Live能更好地区分用户讲话与交通、电视等环境声,官方强调其背景噪声过滤能力更强。面向Android与iOS端的Gemini Live,新模型带来更快响应与更少尴尬停顿,并可将对话上下文连续跟进的时长提升至原来的两倍,以支持更长时间的讨论与头脑风暴;同时还会动态调整回答长度与语气以匹配对话场景。

