Gemini 3.1 Flash Live 正式推出：語音互動體驗迎來史上最大升級

Google 近日正式推出 Gemini 3.1 Flash Live 模型，並將其譽為迄今最高品質的音訊與語音模型。此模型將為 Gemini Live 和 Search Live 功能提供核心驅動力，現已於 Google AI Studio 中透過 Gemini Live API 提供預覽。這次升級被視為 Gemini Live 服務迄今為止最重要的一次更新。

與上一代模型相比，Gemini 3.1 Flash Live 在多項關鍵指標上實現突破。新模型能更有效地識別音高、語速等聲音細節，並顯著降低延遲。其環境噪音過濾能力大幅增強，可更精準地從交通、電視等背景音中分離出使用者語音。在行動裝置的 Gemini Live 應用中，使用者體驗獲得實質改善：回應速度更快，尷尬的停頓減少，並且對話連貫性提升了一倍，讓使用者在長時間腦力激盪時思緒不易中斷。此外，系統現在能動態調整回答的長度和語氣，以適應對話情境。

憑藉新模型的強大能力，Google 正將Search Live 功能推廣至全球超過200個國家與地區，涵蓋所有目前已開通 AI 模式的地區。這標誌著 Google 語音互動與即時搜尋服務，邁入更精準、更流暢的新階段。

本次升級聚焦於底層核心模型的優化，展現出 Google 正致力解決語音 AI 在即時性、抗干擾與上下文理解方面的深層挑戰，為未來更自然、更可靠的人機語音互動奠定堅實基礎。

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

ChatGPT與Claude總是答非所問？掌握3個提問技巧，讓AI秒懂你的需求