Google今天正式宣布推出Gemini 3.1 Flash Live語音模型,作為其「迄今為止最高品質的音頻和語音模型」,為Gemini Live和Search Live服務帶來重大升級。該模型目前已在Google AI Studio透過Gemini Live API提供預覽,標誌著Google在即時語音互動技術上的重要進展。
相比前代2.5 Flash Native Audio,Gemini 3.1 Flash Live能更有效地識別音高、節奏等聲學細節,並降低延遲。它顯著提升環境噪音過濾能力,更好地區分語音與交通、電視等背景聲音。在Android和iOS的Gemini Live應用中,用戶將獲得更快回應,「減少尷尬停頓」,且對話線持續時間延長一倍,確保長時間頭腦風暴中思維連貫。此外,Gemini Live現在能動態調整回答長度和語氣以匹配情境。

