Google 今日正式宣佈推出 Gemini 3.1 Flash Live 模型,並將其稱為迄今為止「最高品質的音頻和語音模型」。該模型將為 Gemini Live 和 Search Live 服務帶來顯著的功能提升。目前,開發者已可透過 Google AI Studio 中的 Gemini Live API 進行預覽訪問。
相較於前代模型,Gemini 3.1 Flash Live 在識別音高、語速等聲音細節方面更為有效,並降低了延遲。其核心改進之一是強大的背景噪音過濾能力,能夠更準確地從交通、電視等環境雜音中分辨出相關語音。在 Android 和 iOS 的 Gemini Live 應用中,新模型能提供更快的響應速度,減少不自然的停頓,並將對話連貫性記憶時長提升了一倍,有助於在長時頭腦風暴中保持思路連貫。此外,Gemini Live 現在還能動態調整回答的長度和語氣以適應對話情境。

