Google Gemini 3.1 Flash Live 正式登場：語音互動功能迎來革新性提升

Google 今日正式宣佈推出 Gemini 3.1 Flash Live 模型，並將其稱為迄今為止「最高品質的音頻和語音模型」。該模型將為 Gemini Live 和 Search Live 服務帶來顯著的功能提升。目前，開發者已可透過 Google AI Studio 中的 Gemini Live API 進行預覽訪問。

相較於前代模型，Gemini 3.1 Flash Live 在識別音高、語速等聲音細節方面更為有效，並降低了延遲。其核心改進之一是強大的背景噪音過濾能力，能夠更準確地從交通、電視等環境雜音中分辨出相關語音。在 Android 和 iOS 的 Gemini Live 應用中，新模型能提供更快的響應速度，減少不自然的停頓，並將對話連貫性記憶時長提升了一倍，有助於在長時頭腦風暴中保持思路連貫。此外，Gemini Live 現在還能動態調整回答的長度和語氣以適應對話情境。

憑藉此次升級，Google 正將Search Live 服務推廣至全球超過 200 個國家或地區，覆蓋所有當前已開放 AI 模式的語言和區域。這一部署標誌著 Google 正致力於將其先進的語音互動能力帶給更廣泛的全球用戶。隨著模型在理解能力和實時性上的突破，語音助手有望在嘈雜的真實場景中提供更可靠、更自然的服務體驗。

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略