ChatGPT 的 GPT-4o 模型更新帶來了許多令人興奮的功能。這個全能模型整合了音訊、視訊與文字處理能力,讓 AI 互動變得更加自然高效。本文為你解析 GPT-4o 的主要特色,幫助你充分利用這些新功能。
即時語音與影片的多模態互動模式
GPT-4o 的最大亮點是強大的多模態能力。它不再局限於文字交流,能像真人一樣即時進行對話,甚至可以識別用戶語氣背後的情緒。你能用語音與 ChatGPT 交流,AI 會根據喘氣聲判斷你可能剛運動完,這種人性化的互動體驗相當有趣。
GPT-4o 也支援影片畫面截取分析,你可以透過螢幕分享問題,AI 會即時描述所見景象並提供建議。在 GPT-4o 的展示中,兩個 AI 甚至可以互相對話、一起唱歌,展現了更強的人機協作潛力。
智慧視覺辨識與教育場景應用
GPT-4o 的視覺辨識功能為視障人士帶來實質幫助。它可以報告周圍環境、描述物件,甚至判斷所在空間可能屬於哪種職業的工作間。這項功能在醫療保健領域也有巨大潛力,能輔助患者了解自身狀況。

