OpenAI 推出的全新全能模型 GPT-4o,正在重新定義我們與 AI 互動的方式。這個模型的核心升級在於其原生多模態能力,能夠即時、無縫地處理文字、音訊和視覺資訊,帶來前所未有的自然對話體驗與實用功能,顯著提升了生活與工作的效率。
自然流暢的語音對話與回應速度
GPT-4o 最直觀的改進在於對話的自然度。新版模型在語音互動中,實現了更接近人類的回應速度,延遲大幅降低。這意味著你和 ChatGPT 聊天時,不再需要等待漫長的「思考」時間,對話節奏幾乎與真人通話無異,交流起來更加順暢自然。
這種低延遲的體驗,得益於模型對音訊輸入的即時處理能力。它能夠感知你的語氣和情緒,並相應地調整回應方式,使得 AI 更像一個真實的對話夥伴,無論是練習外語還是日常閒聊,沉浸感都大大增強。
高級語音模式與桌面應用的便捷性
除了模型的底層升級,OpenAI 還在產品形態上進行了重要更新。專為 Mac 使用者打造的桌面應用程式現已開放,透過簡單的快速鍵(Option + Space)即可隨時呼叫,無需開啟瀏覽器,工作流程被打斷的煩惱一掃而空。
更值得期待的是,針對 ChatGPT Plus 使用者的高級語音模式已開始小範圍測試。儘管因為音色爭議有所推遲,但這個功能承諾提供極為逼真、富有表現力的音訊回應,預計將在秋季逐步向所有 Plus 使用者推出,為人機語音互動樹立新標竿。


