Google 宣布推出Gemini 3.1 Flash Live,並稱其為目前「最高品質的音訊與語音模型」,用於驅動Gemini Live與Search Live的重大升級。該模型現已在Google AI Studio透過Gemini Live API提供預覽版,相較 2.5 Flash Native Audio 具備更低延遲,並更擅長辨識語音中的音高、語速等細微聲學特徵。
在複雜環境中,Gemini 3.1 Flash Live 能更好地區分使用者說話與交通、電視等環境聲,官方強調其背景噪音過濾能力更強。面向 Android 與 iOS 端的 Gemini Live,新模型帶來更快回應與更少尷尬停頓,並可將對話脈絡連續跟進的時長提升至原來的兩倍,以支援更長時間的討論與腦力激盪;同時也會動態調整回答長度與語氣以符合對話情境。

