ChatGPT 近期迎來重大更新,GPT-4o 模型正式上線,其中「o」代表全能(Omni),意味著它不再局限於文字,而是整合了音訊、視訊與文字的多模態推理能力。相比上一代 GPT-4 Turbo,GPT-4o 在對話流暢度、即時翻譯、AI 互動等方面都有顯著提升,為用戶帶來更自然、更溫暖的智能體驗。
自然流暢的對話與即時翻譯
GPT-4o 最大的亮點是語音互動的全面進化。它不僅能聽懂用戶的語氣和情緒,還能根據聲線要求調整回覆風格,彷彿真人一般自然交流。同時,新版支援 50 種語言的即時口譯,跨語言溝通不再需要借助第三方工具。無論是商務會議還是旅行問路,只需開口說話,GPT-4o 就能快速將內容翻譯成目標語言,真正消除語言障礙。
在日常使用中,用戶可以直接用語音提問,模型會即時判斷語境並給出帶情感色彩的回應。比如講睡前故事時,它能模仿不同角色聲音,讓故事更生動;開會時,它又能化身會議秘書,自動記錄關鍵決策。這種多模態互動讓 ChatGPT 的使用場景大大拓寬。
強大的即時視覺與螢幕分享功能
GPT-4o 新增的視覺能力讓 AI 能夠「看懂」世界。用戶可以透過相機或螢幕分享功能,讓模型即時觀察畫面並作出反應。舉個例子,當你編寫程式碼遇到 bug 時,只需分享螢幕,GPT-4o 就會像超級家教一樣逐行分析程式碼,並用語音解釋錯誤原因。同樣,處理影片剪輯、設計圖片時,它也能根據螢幕內容給出針對性建議,效率遠超過去的截圖描述模式。
此外,ChatGPT 現在已經支援直接從 Google Drive 和 OneDrive 上傳檔案,用戶還能對表格和圖表進行互動式操作,並導出客製化的演示圖表。這一更新顯著提升了數據分析的效率,尤其適合需要頻繁處理報表的職場人士。


