OpenAI推出的GPT-4o全能模型彻底改变了人机交互的方式,其中“o”代表全能(Omni)。这才使得ChatGPT不仅仅是文字助手,而是能听、能看、能说的伙伴。我根据实际使用体验,重点聊聊最实用的两个新功能:语音对话与屏幕分享,看看它们究竟能解决什么问题。
自然流畅的语音对话与即时翻译
GPT-4o最让我惊艳的是它那极其自然的语音对话能力。它能够识别你说话的语气和情绪,甚至在你犹豫时耐心等待,不再像以前那样生硬。这不仅是噱头,全新升级的即时翻译功能支持50种语言,可以像专业口译员一样实时进行跨语言交流,我在国外开会时就靠它解决了不少麻烦。
不管是帮孩子讲睡前故事,还是充当会议中的秘书,ChatGPT都能根据你的情绪条件调整声线和用词。对于有语言障碍或需要陪伴感的用户而言,这种拟人化的交流体验是过去技术难以实现的,它能做到真正消除沟通隔阂。
屏幕分享功能,打造你的超级家教
写作、编程、剪片遇到卡点,之前必须截图或打字描述给ChatGPT,特别麻烦。现在只要开启ChatGPT的屏幕分享功能,模型可以直接读取你的屏幕内容,并针对你正在处理的问题进行分析。我试过一次,在写代码时遇到一个bug,它看着我的屏幕直接语音指导我如何修改,就像身边有位超级家教。


