這次 ChatGPT 的更新核心是 GPT-4o(o=omni,全能)。它把文字、語音與視覺理解整合到同一套推理能力裡,讓 ChatGPT 不只會「回答」,也更像在「對話」和「協作」。下面把最值得關注的新功能與落地場景整理給你。
GPT-4o 到底升級了什麼:從文字助手變成全能模型
GPT-4o 讓 ChatGPT 同時具備文字、音訊、影像的理解與生成能力,不再需要在不同模式間來回切換。對使用者最直觀的變化是:同一個對話裡,你可以用說的、打字的、傳圖的方式混著來,ChatGPT 也能保持上下文連貫。相較以往更偏「問答」,現在更強調「即時互動」。
更自然的語音對話與即時翻譯:跨語言溝通更順
在語音對話上,ChatGPT 的回應更接近真實交流:節奏更自然,也更能跟著你的語氣走。翻譯不只是把句子換語言,而是支援多語言快速切換,適合旅行問路、跨國會議臨時口譯、或把訪談內容邊聽邊整理。想要效果更穩,建議在開頭直接告訴 ChatGPT 你的目標語言與場景(例如「用更口語的日文幫我口譯」)。

