ChatGPT 這輪更新的重點很明確:透過 GPT-4o 將文字、語音與圖像能力整合到同一套對話裡。對日常用戶來說,ChatGPT 變得更像「隨叫隨到的助手」,而不僅是打字問答的工具。
GPT-4o 的「全能」對話:文字、語音、圖像一起用
GPT-4o 的 o 源自 omni(全能),意味著 ChatGPT 不再只擅長文字,而是將音訊、影像與文字推理放在同一條工作流裡。你可以在同一個對話中讓 ChatGPT 看圖、讀文件,並以更自然的方式解釋給你聽。相較舊模型,這種多模態整合讓切換成本更低,溝通節奏也更流暢。
更流暢的語音互動 + 即時翻譯,跨語言更省力
ChatGPT 的語音對話變得更貼近真人交流:你可以直接開口追問、打斷、補充條件,ChatGPT 會跟著上下文走。翻譯也不再只是「翻譯一段文字」,而是支援在不同語言之間快速切換,適合做即時口譯式的溝通。對出差、會議或線上協作來說,ChatGPT 的即時翻譯能明顯減少來回確認。


