OpenAI为ChatGPT带来了两波重磅更新:GPT-4o全能模型与Canvas画布协作界面。前者让AI真正“看见”和“听见”世界,后者则让创作与编程像和搭档一起写稿一样流畅。本文将带你拆解这些新功能,看看它们如何改变日常使用体验。
GPT-4o的多模态交互能力
GPT-4o中的“o”代表全能(omni),不再局限于文字。它支持实时语音对话,能感知语气和情绪,甚至进行即席翻译——掌握50种语言,你讲中文它直接输出英文口译。更实用的是屏幕分享功能:遇到程序bug或剪辑问题,只需共享屏幕,GPT-4o就能“看着”你的操作给出语音指导,像一位实时在线的超级家教。
此外,GPT-4o还具备视觉理解能力,能通过摄像头识别场景,帮助视障者“听见”周围环境。这些能力让ChatGPT从聊天工具变成了能看、能听、能教的AI伙伴。
Canvas画布:像教练一样陪你创作
Canvas是一个独立打开的协作窗口,彻底告别传统对话框。当你撰写长文或编写代码时,Canvas会提供行内批注、建议修改和直接编辑功能。比如写文章,你可以选中一段文字让AI润色、调整语气,甚至一键转换为表格或诗歌;写代码时,Canvas支持代码审查、错误修复和语言转换(如Python转JavaScript)。所有修改都保留历史版本,你随时可以回退。


