OpenAI為ChatGPT帶來了兩波重磅更新:GPT-4o全能模型與Canvas畫布協作介面。前者讓AI真正「看見」和「聽見」世界,後者則讓創作與程式設計像和夥伴一起寫稿一樣流暢。本文將帶你拆解這些新功能,看看它們如何改變日常使用體驗。
GPT-4o的多模態交互能力
GPT-4o中的「o」代表全能(omni),不再局限於文字。它支援即時語音對話,能感知語氣和情緒,甚至進行即席翻譯——掌握50種語言,你講中文它直接輸出英文口譯。更實用的是螢幕分享功能:遇到程式bug或剪輯問題,只需共享螢幕,GPT-4o就能「看著」你的操作給出語音指導,像一位即時線上的超級家教。
此外,GPT-4o還具備視覺理解能力,能透過攝影鏡頭辨識場景,幫助視障者「聽見」周圍環境。這些能力讓ChatGPT從聊天工具變成了能看、能聽、能教的AI夥伴。
Canvas畫布:像教練一樣陪你創作
Canvas是一個獨立開啟的協作視窗,徹底告別傳統對話框。當你撰寫長文或編寫程式碼時,Canvas會提供行內註解、建議修改和直接編輯功能。例如寫文章,你可以選中一段文字讓AI潤色、調整語氣,甚至一鍵轉換為表格或詩歌;寫程式碼時,Canvas支援程式碼審查、錯誤修復和語言轉換(如Python轉JavaScript)。所有修改都保留歷史版本,你隨時可以還原。


