ChatGPT 在最近一次重大更新中,帶來了多項令人興奮的功能升級,其中 GPT-4o 模型的推出堪稱里程碑。這次更新不僅提升了回應速度,還讓 AI 更貼近真實人類的互動方式,從單純的文字對話進化到能理解圖像、聲音和情緒。本文就帶大家詳細了解這些 ChatGPT 新功能,看看它們如何改變我們的日常使用習慣。
GPT-4o 模型:全能與速度的完美融合
GPT-4o 中的「o」代表「全能(omni)」,它整合了音訊、視訊及文字的推理能力,成為一個真正的多模態模型。相比上一代 GPT-4 Turbo,GPT-4o 的 API 速度更快,成本降低高達 50%,回應幾乎是即時的,速度比 GPT-4 快了兩倍。用戶現在可以在 ChatGPT 中體驗更流暢的對話,不再有長時間的等待。
令人驚喜的是,GPT-4o 能夠像真人一樣即時對話,甚至辨識用戶語氣背後的情緒。例如,它可以透過喘氣聲判斷你剛運動完,並給出個人化的回應。兩個 GPT-4o 之間甚至可以互相交流,描述看到的景象,甚至一起合唱歌曲,展現出 AI 之間更強的協作能力。這些 ChatGPT 新功能大大提升了互動的自然度與趣味性。
多模態互動與視覺辨識能力
GPT-4o 的核心升級之一就是視覺能力。它現在可以良好地輔助視障者了解周圍環境,例如報告方位或如何叫計程車。在展示中,測試員掃描周遭環境後,GPT-4o 能即時辨識物體並推斷可能的工作場景,這在醫療保健與個人輔助領域展現出巨大潛力。

