ChatGPT 近期迎來多項重磅更新,無論你是日常用戶還是重度依賴 AI 的創作者,這些新功能都值得了解。從更自然的語音交流到多模態理解,OpenAI 正在讓 ChatGPT 變得更靈活、更聰明。本文將盤點其中最值得關注的幾個新特性。
GPT-4o:全能多模態模型
GPT-4o 的發布是 ChatGPT 里程碑式的升級。它不僅支援文字,還能直接理解圖片、音訊和影片內容。例如,你可以上傳一張設計草圖,讓它給出最佳化建議;或者錄一段會議錄音,讓它自動產生摘要。GPT-4o 的回應速度也大幅提升,幾乎接近即時對話體驗。相比前代 GPT-4,它在推理和創意任務上的表現更穩定。
值得注意的是,Plus 用戶可以獲得更高智慧層級的服務,而免費用戶也能在標準智慧模式下不限次數使用 GPT-5(需留意濫用防範機制)。如果你還沒體驗過 GPT-4o 的多模態能力,建議在 ChatGPT 設定中手動切換模型試試。
語音引擎:15 秒複製你的聲音
OpenAI 推出的語音引擎(Voice Engine)讓聲音複刻變得異常簡單。只需提供一段 15 秒的音訊樣本,系統就能模擬出與該聲音高度一致的語音輸出。這項功能不僅可用於個人語音助手,還能幫助語言學習者糾正發音,或是為有聲內容創作者提供便捷的配音方案。目前該功能在部分區域測試,但已展現巨大潛力。
配合改進後的語音模式,你可以直接用自然語音與 ChatGPT 交談,無需打字就能完成提問、調整語氣甚至多輪對話。Altman 曾承諾新版語音品質會有顯著提升,實際體驗確實更加流暢自然。


