Google 宣布推出Gemini 3.1 Flash Live,稱其為目前「最高品質的音訊與語音模型」,將用於推動Gemini Live與Search Live的重大升級。該模型已透過Google AI Studio的Gemini Live API提供預覽版本,相較 2.5 Flash Native Audio 具備更低延遲,並更擅長辨識音高、語速等聲學細節。
在實際對話體驗上,Gemini 3.1 Flash Live 更能從交通、電視等環境聲中區分並擷取有效人聲,並更有效過濾背景噪音。Google 表示,Gemini Live 在 Android 與 iOS 上將獲得更快回應、減少尷尬停頓,同時可將對話上下文維持時間提升至原來的兩倍,以支援更長時間的腦力激盪與連續追問;系統也會動態調整回答長度與語氣以匹配交流情境。

