Google 近日正式推出 Gemini 3.1 Flash Live 模型,並將其譽為迄今最高品質的音訊與語音模型。此模型將為 Gemini Live 和 Search Live 功能提供核心驅動力,現已於 Google AI Studio 中透過 Gemini Live API 提供預覽。這次升級被視為 Gemini Live 服務迄今為止最重要的一次更新。
與上一代模型相比,Gemini 3.1 Flash Live 在多項關鍵指標上實現突破。新模型能更有效地識別音高、語速等聲音細節,並顯著降低延遲。其環境噪音過濾能力大幅增強,可更精準地從交通、電視等背景音中分離出使用者語音。在行動裝置的 Gemini Live 應用中,使用者體驗獲得實質改善:回應速度更快,尷尬的停頓減少,並且對話連貫性提升了一倍,讓使用者在長時間腦力激盪時思緒不易中斷。此外,系統現在能動態調整回答的長度和語氣,以適應對話情境。

