近期,ChatGPT 的更新核心在於從「純文字聊天」擴展到「聽、看、處理檔案」的多功能助手。從流暢的語音對話、便捷的桌面應用,到雲端檔案直接傳輸,ChatGPT 正逐步融入日常工作場景。
語音模式仿若真實對話:回應更快、更穩定,情緒細節更豐富
OpenAI 正逐步向部分用戶釋出進階語音模式,使 ChatGPT 的語音回應更加生動自然,並注重對話節奏與停頓。這功能宛如進行「口頭討論」,適用於步行時反思、駕車時規劃,或會議前快速演練問答。對於跨語言溝通者,ChatGPT 結合即時翻譯,幾乎能實現「隨行口譯」的便利。
拓展至影音處理:ChatGPT 多模態功能實用性大增
依循 GPT-4o 的多模態發展方向,ChatGPT 已能整合處理文字、圖像與音訊。使用者可上傳圖片請 ChatGPT 解讀內容、協助描述情境,或以語音直接說明需求後產出文字方案。官方亦表示將逐步擴充影片處理功能,但建議等待正式開放後再使用。


