OpenAI 推出的 GPT-4o 全能模型徹底改變了人機互動的方式,其中「o」代表全能(Omni)。這讓 ChatGPT 不再只是文字助手,而是能聽、能看、能說的夥伴。本文根據實際使用體驗,重點介紹最實用的兩個新功能:語音對話與螢幕分享,看看它們究竟能解決什麼問題。
自然流暢的語音對話與即時翻譯
GPT-4o 最令人驚豔的是它極其自然的語音對話能力。它能辨識你說話的語氣與情緒,甚至在你猶豫時耐心等待,不再像過去那樣生硬。這並非只是噱頭,全新升級的即時翻譯功能支援 50 種語言,能像專業口譯員一樣即時進行跨語言交流。我在國外出差時就靠它解決了不少溝通難題。
無論是幫孩子講睡前故事,還是在會議中擔任祕書角色,ChatGPT 都能根據你的情緒條件調整聲線與用詞。對於有語言障礙或需要陪伴感的用戶來說,這種擬人化的交流體驗是過去技術難以實現的,它能真正消除溝通隔閡。
螢幕分享功能,打造你的超級家教
寫作、程式開發、影片剪輯遇到卡關時,過去必須截圖或打字描述給 ChatGPT,非常麻煩。現在只要開啟 ChatGPT 的螢幕分享功能,模型就能直接讀取你的螢幕內容,並針對你正在處理的問題進行分析。我實際測試過一次:寫程式時遇到一個 bug,它看著我的螢幕直接語音指導我如何修改,就像身邊有一位超級家教。


