ChatGPT-4o объединяет текст, голос и визуальные рассуждения в единую систему возможностей, делая упор на более естественный диалог и более быстрый отклик. Для обычных пользователей самое заметное изменение в том, что он не только «умеет болтать», но и лучше «умеет смотреть, слушать и помогать делать дела».
ChatGPT-4o — «универсальная» модель: не только умеет писать
Буква «o» в ChatGPT-4o означает omni (универсальный), то есть одна и та же модель одновременно обрабатывает текст, аудио и изображения. По сравнению с прошлым, когда всё в основном держалось на текстовых командах, ChatGPT-4o больше подходит для задач «под ключ»: оперативного общения, объяснения изображений, анализа документов и данных и т. п. Темп диалога тоже ближе к живому общению: уточняющие вопросы и дополнительные пояснения будут идти более плавно.
Голосовой диалог и мгновенный перевод: издержки общения заметно снижаются
ChatGPT-4o улучшил естественность голосового взаимодействия: более связная интонация, более быстрый отклик и более высокая терпимость к разговорной манере речи. Ещё практичнее — мгновенный перевод: ChatGPT-4o может быстро переключаться между несколькими языками, что подходит для международных встреч, общения в командировках или тренировки разговорной речи в роли портативного переводчика. Можно прямо попросить: «слушай и переводи одновременно, сохраняя вежливый тон» — и результат будет больше похож на диалог, чем на традиционный посрочный перевод.


