ChatGPT近期迎来一波重磅更新,从GPT-4o的多模态能力到o系列推理模型的加入,让这款AI助手变得更加全能。不论你是日常使用者还是专业创作者,这些新功能都能让工作效率和交互体验提升一个台阶。本文就来逐一拆解这些值得关注的变化。
GPT-4o全面升级:多模态交互更自然
GPT-4o作为OpenAI的全能型旗舰模型,正式向所有用户开放,免费版和Plus版都能体验。它不再局限于文字,而是整合了语音、图像和视频的处理能力。比如你可以直接拍照让GPT-4o识别场景中的物体,或者上传PDF让它帮你分析数据。
最惊喜的是语音对话模式,交互延迟大幅降低,听起来就像跟真人聊天。GPT-4o还能根据语气判断你的情绪状态,在交流中提供更有同理心的回应。如果你还没试过,可以让它陪你练习外语口语或者辅导孩子做数学题。
o3与o4-mini推理模型正式上线
OpenAI推出了o3和o4-mini系列模型,专为复杂推理和深度分析设计。o3能够“用图像思考”,结合Python工具处理视觉元素,适合解决学术研究和逻辑推理这类高难度任务。而o4-mini则主打高效率,在保证推理质量的同时大幅提升响应速度。

