ChatGPT在最近一次重大更新中,带来了多项令人兴奋的功能升级,其中GPT-4o模型的推出堪称里程碑。这次更新不仅提升了响应速度,还让AI更贴近真实人类的交互方式,从单纯的文字对话进化到能理解图像、声音和情绪。本文就带大家详细了解这些ChatGPT新功能,看看它们如何改变我们的日常使用习惯。
GPT-4o模型:全能与速度的完美融合
GPT-4o中的“o”代表“全能(omni)”,它整合了音讯、视讯及文字的推理能力,成为一个真正的多模态模型。相比上一代GPT-4 Turbo,GPT-4o的API速度更快,成本降低高达50%,响应几乎是即时的,速度比GPT-4快了两倍。用户现在可以在ChatGPT中体验更流畅的对话,不再有长时间的等待。
令人惊喜的是,GPT-4o能够像真人一样实时对话,甚至识别用户语气背后的情绪。例如,它可以通过喘气声判断你刚运动完,并给出个性化的回应。两个GPT-4o之间甚至可以互相交流,描述看到的景象,甚至一起合唱歌曲,展现出AI之间更强的协作能力。这些ChatGPT新功能大大提升了交互的自然度和趣味性。
多模态交互与视觉识别能力
GPT-4o的核心升级之一就是视觉能力。它现在可以良好地辅助视障者了解周围环境,比如报告方位或如何叫出租车。在演示中,测试员扫描周遭环境后,GPT-4o能即时识别物体并推断可能的工作场景,这在医疗保健和个人辅助领域展现出了巨大潜力。

