這次 ChatGPT 的重點更新,是將 GPT-4o 作為「全能(omni)」模型引入日常對話中。它不再僅擅長文字回覆,而是將文字、圖像與語音能力整合到同一個推理流程。你會明顯感受到 ChatGPT 的互動更像在「對話」,而非單純的「問答」。
GPT-4o 是什麼:讓 ChatGPT 變成多模態助手
GPT-4o 的「o」代表 omni,核心變化在於多模態功能:在同一輪對話中,ChatGPT 能理解文字,也能解析你上傳的圖片與語音輸入。對使用者來說,無需先將圖片內容「轉述成文字」再讓 ChatGPT 推理,流程更短、更直覺。GPT-4o 也讓 ChatGPT 更適合處理混合任務,例如邊看截圖邊解釋步驟。
對話體驗升級:更自然、更快,也更會接話
GPT-4o 強調自然流暢的對話節奏,ChatGPT 在多輪對話中更容易維持上下文一致,回答也更貼近口語交流。相較於僅用文字時的「分段式輸出」,你會發現它更願意追問關鍵條件,將需求補齊再繼續。對於寫作、總結、邏輯整理這類任務,ChatGPT 的輸出會更乾淨俐落。


