随着 GPT-4o 全能模型的推出,ChatGPT 在语音对话、视觉理解与即时互动方面实现了质的飞跃。从即时口译到萤幕共享辅助编程,再到与 Apple 生态的深度整合,这些新功能正在重塑 AI 与人类协作的方式。
自然语音对话与即时翻译
GPT-4o 最直观的变化在于语音互动。它不再只是文字聊天,而是能听懂语气、情绪,并以同样富有情感的声音回应。结合对 50 种语言的支持,ChatGPT 能在对话中即时完成口译,跨越语言障碍。这项功能对于跨国会议、语言学习等场景尤其实用。
萤幕共享与 AI 家教
透过萤幕共享,ChatGPT 可以即时读取用户展示的程式码、图表或设计稿,并针对游标位置的问题给予语音解答。它就像一位超级家教,无需用户手动截图或输入冗长的问题描述,就能高效解决编程、剪辑或数据分析中的疑难。这项能力在教育与技术支援领域潜力巨大。
记忆工具与个人化创意
GPT-4o 新增的记忆功能让 AI 能长期保留用户偏好,例如记住你喜欢的写作风格或学习计画。同时,它还能根据要求生成床边故事、创意企划等个人化内容,并贴合你指定的声线或情绪。此外,ChatGPT Plus 用户可自建专属 GPTs,进一步强化客制化体验。
Mac 桌面应用与 Apple 整合
ChatGPT for Mac 桌面应用透过 Option + Space 快速键唤醒,无需浏览器即可随时使用。更值得期待的是,Apple 在 WWDC 上宣布将 ChatGPT 整合到 Siri 以及 iOS 18、iPadOS 18 与 macOS Sequoia 中,届时用户可直接在 Apple 装置上调用 GPT-4o 的能力,且无需单独注册 OpenAI 帐户。
进阶语音模式即将普及
OpenAI 已向部分 ChatGPT Plus 用户推出进阶语音模式的 Alpha 版本,它能模仿逼真的语调、捕捉用户的喘息或笑声,使对话更具沉浸感。该功能计画在秋季逐步向所有 Plus 用户开放。虽然此前因声音争议有所推迟,但最终版本将兼顾安全性与表现力。这些新功能让 ChatGPT 从工具升级为真正的智慧伙伴。