ChatGPT近期迎来功能大升级,最新模型GPT-4o(全能模型)已经全面开放。用户现在可以与ChatGPT进行更自然的语音对话、实时屏幕分享,并且能够直接在开发工具中编辑代码。这些新功能让ChatGPT从一个单纯的聊天机器人,进化为真正能够理解多模态信息、贴心陪伴的智慧助手。无论是免费用户还是付费订阅用户,都能体验到这些令人兴奋的改变,本文将为你全面梳理这些核心新功能。
GPT-4o多模态能力:语音、影像与文字全面整合
GPT-4o将音讯、视讯与文字推理能力完全融合,成为一个真正的全能模型。相比上一代GPT-4 Turbo,GPT-4o的API速度提升了两倍,成本降低了50%,反应几乎达到即时。用户不仅可以用文字交流,还能上传图片、文件让AI分析,甚至通过摄像头让ChatGPT实时描述周围场景,帮助视障人士了解环境。两个GPT-4o之间甚至可以相互对话、合唱歌曲,展示出AI之间更强的协作潜力。
语音对话更自然 学会识别语气与情绪
新版ChatGPT的语音模式进行了重大升级,对话体验如同与真人朋友交谈般生动。它能够识别用户语气背后隐含的情绪,并根据喘气、笑声等声音做出相应反应。在教学中,GPT-4o能够像老师一样一步步引导学生解答问题,而不是直接给出答案,极大提升了学习效率。此外,记忆能力的增强让ChatGPT能记住用户的习惯和偏好,提供更具个性化的回应。

