Google Gemini 3.1 Flash Live 正式登場：語音模型迎來史上最大升級

Google 於近日正式宣布 Gemini 3.1 Flash Live，並將其稱為迄今為止「最高品質的音頻與語音模型」。此模型旨在為 Gemini Live 和 Search Live 提供核心升級，現已透過 Google AI Studio 中的 Gemini Live API 開放預覽。

此次升級帶來了多項顯著改進：模型能更有效地識別音調、節奏等聲學細節，並提供相比前代 2.5 Flash Native Audio 更低的延遲。它在區分相關語音與環境噪音（如交通或電視聲）方面表現更佳，特別加強了背景噪音過濾能力。在 Android 和 iOS 的 Gemini Live 中，3.1 Flash Live 實現了更快的回應速度，減少了對話中的尷尬停頓，並能將對話線程追蹤時間延長一倍，有助於在長時間腦力激盪中保持思維連貫。此外，Gemini Live 現已能動態調整回答長度和語調以匹配即時情境。

Google 同時基於此模型，在全球超過 200 個國家或所有 AI Mode 可用的語言及地區，全面推出 Search Live 功能。這項舉措標誌著 Google 語音互動技術的進一步普及與優化。

此次升級不僅提升了語音 AI 的即時性與準確性，也為更自然、流暢的人機對話體驗奠定了基礎，預示著智能助手在日常應用中的潛力將進一步釋放。

搜尋文章

熱門文章

ChatGPT 最好用的幾個提示詞（Prompt），真正能提升 10 倍效率的用法

Claude Code 安裝總是報錯　手把手教你三步搞定配置難題

ChatGPT Claude Gemini Midjourney輸出翻車的排錯清單和提示詞KISS技巧

高效整合 ChatGPT、Claude、Gemini 與 Midjourney：解決內容輸出不一致與改稿崩潰的工作流程

Spotify播放錯誤代碼總整理與解決攻略