В этом обновлении ChatGPT-4o акцент предельно ясен: объединить возможности работы с текстом, изображениями и голосом в одной модели, чтобы диалог стал естественнее, а реакция — быстрее. Ниже — несколько самых заметных функций, которые помогут быстро понять, что именно обновили в ChatGPT-4o.
Насколько силён «универсальный» ChatGPT-4o на деле
Буква «o» в ChatGPT-4o — от omni, то есть более универсальные мультимодальные возможности: он больше не силён только в тексте. В рамках одного и того же диалога вы можете дать ChatGPT-4o «прочитать» картинку, послушать вашу речь и затем ответить голосом — без лишнего этапа «сначала перевести в текст, потом анализировать».
По сравнению с прежним подходом, где приходилось переключать инструменты или процессы, ChatGPT-4o больше похож на единую рабочую линию ввода и вывода — удобно для частых сценариев вроде повседневных вопросов, учёбы и систематизации материалов.
Живой голосовой диалог и мгновенный перевод — ещё удобнее
Голосовой режим ChatGPT-4o делает упор на «разговорность»: задержка ответа ниже, и в диалоге проще перебивать и вставлять реплики — ощущение интерактивности заметно выросло. Тем, кто хочет задавать вопросы устно и на ходу фиксировать ключевые мысли, ChatGPT-4o будет гораздо удобнее, чем один лишь набор текста.
В переводе ChatGPT-4o поддерживает быстрое переключение между языками, а в связке с голосом даёт опыт, близкий к «мгновенному устному переводу». В командировках, на международных встречах или при общении с иностранными клиентами использование ChatGPT-4o для двустороннего переключения между китайским и английским часто практичнее, чем разовые переводы.


