Google宣布推出Gemini 3.1 Flash Live,称其为目前“最高质量的音频与语音模型”,将用于推动Gemini Live与Search Live的重大升级。该模型已通过Google AI Studio的Gemini Live API提供预览版本,相比2.5 Flash Native Audio具备更低延迟,并更擅长识别音高、语速等声学细节。
在实际对话体验上,Gemini 3.1 Flash Live更能从交通、电视等环境声中区分并提取有效人声,并更有效过滤背景噪音。Google表示,Gemini Live在Android与iOS上将获得更快响应、减少尴尬停顿,同时可将对话上下文保持时间提升至原来的两倍,以支持更长时间的头脑风暴与连续追问;系统还会动态调整回答长度与语气以匹配交流场景。

