OpenAI 的 ChatGPT 在過去一年中經歷了驚人的功能迭代,從多模態互動到深度推理,每次更新都旨在重塑用戶體驗。本文將為您梳理這些核心新功能,揭示 ChatGPT 如何從文字聊天機器人,進化為更全能、更智能的日常助手。
全能模型 GPT-4o:開啟多模態互動新時代
ChatGPT 最重要的升級之一是 GPT-4o 模型的推出。這個「o」代表「全能」(omni),意味著模型能無縫整合文字、音訊和視覺的推理能力。它帶來自然如真人般的對話體驗,回應速度極快,並能理解和生成帶有情感的語音。
其實時翻譯功能支援超過 50 種語言,能充當高效的口譯員。更實用的是其螢幕共享能力,當您遇到程式設計或軟體使用難題時,只需分享螢幕,ChatGPT 就能「看到」問題並提供語音指導,就像一個隨傳隨到的超級家教。
無縫整合的桌面客戶端與蘋果合作
為了讓互動更便捷,ChatGPT 推出了官方桌面客戶端。在 macOS 上,用戶只需按下 Option+空格鍵就能隨時呼叫 ChatGPT,無需開啟瀏覽器,實現真正的隨用隨問。該應用支援直接上傳本機檔案、圖片並進行語音對話。
此外,OpenAI 與蘋果的深度合作將 ChatGPT 的能力整合至 Siri 及作業系統層面。未來用戶在蘋果裝置上無需帳戶即可直接呼叫由 GPT-4o 驅動的智能功能,這大幅降低了使用門檻,讓人工智慧助手變得無所不在。


