ChatGPT近期迎来多项重磅更新,无论你是日常用户还是重度依赖AI的创作者,这些新功能都值得了解。从更自然的语音交流到多模态理解,OpenAI正在让ChatGPT变得更灵活、更聪明。本文将盘点其中最值得关注的几个新特性。
GPT-4o:全能多模态模型
GPT-4o的发布是ChatGPT里程碑式的升级。它不仅支持文本,还能直接理解图片、音频和视频内容。例如,你可以上传一张设计草图,让它给出优化建议;或者录一段会议录音,让它自动生成摘要。GPT-4o的响应速度也大幅提升,几乎接近实时对话体验。相比前代GPT-4,它在推理和创意任务上的表现更稳定。
值得注意的是,Plus用户可以获得更高智慧层级的服务,而免费用户也能在标准智能模式下不限次数使用GPT-5(需注意滥用防范机制)。如果你还没体验过GPT-4o的多模态能力,建议在ChatGPT设置中手动切换模型试试。
语音引擎:15秒克隆你的声音
OpenAI推出的语音引擎(Voice Engine)让声音复刻变得异常简单。只需提供一段15秒的音频样本,系统就能模拟出与该声音高度一致的语音输出。这项功能不仅可用于个人语音助手,还能帮助语言学习者纠正发音,或是为有声内容创作者提供便捷的配音方案。目前该功能在部分区域测试,但已展现巨大潜力。
配合改进后的语音模式,你可以直接用自然语音与ChatGPT交谈,无需打字就能完成提问、调整语气甚至多轮对话。奥特曼曾承诺新版语音品质会有显著提升,实际体验确实更加流畅自然。


