本次更新以GPT-4o為核心,整合語音、圖像與記憶功能,讓ChatGPT從單純聊天工具轉變為隨手可用的助手。以下將依據最常見的使用場景,逐一解析ChatGPT的新功能。
GPT-4o整合文字、圖片與音頻於單一對話
GPT-4o的設計理念是「全能(omni)」,對ChatGPT用戶而言,最明顯的改進在於多模態互動更流暢:在同一對話中,不僅能輸入文字,還能上傳圖片或檔案,讓ChatGPT直接讀取內容進行推理,而非僅止於表面描述。
若你慣用ChatGPT整理資料,這項整合能大幅簡化流程:無需先將截圖、表格或PDF轉為純文字,直接上傳即可讓ChatGPT提取重點、比較差異或生成清單,有效降低溝通成本。
進階語音與即時翻譯功能:將ChatGPT變身隨身口譯員
ChatGPT的語音互動體驗更貼近自然對話:用戶可以邊說邊調整需求,ChatGPT也能迅速回應,無需等待每句話的處理時間。當對話中混合不同語言時,ChatGPT支援快速切換,並提供近乎即時的口譯式翻譯。
對於經常參與跨國會議的使用者,可以讓ChatGPT將同一句話以不同語氣重述,或將口語內容轉譯為正式的郵件版本;而語言學習者則可請ChatGPT糾正發音、提供同義詞替換與例句,使練習更為連貫。


