В этот раз акценты обновления ChatGPT предельно ясны: он стал лучше не только «писать», но и «слушать, смотреть, говорить». От мультимодальных возможностей GPT-4o до быстрого вызова на десктопе и анализа файлов — ChatGPT превращает диалог в более удобный рабочий процесс.
Запуск GPT-4o: ChatGPT из текстового помощника превращается в «универсальный» диалог
Буква «o» в GPT-4o означает omni (всё-в-одном), благодаря чему ChatGPT может в рамках одной модели обрабатывать текст, изображения и голос и другие типы ввода. На практике это ощущается как более быстрые ответы и более естественное удержание контекста; при переключении задач «нить» разговора тоже реже обрывается. В смешанных сценариях — повседневное письмо, объяснение графиков, извлечение информации с изображений — прирост эффективности у ChatGPT заметен.
Живой голос и перевод в реальном времени: ChatGPT больше похож на коллегу, который может в любой момент вставить реплику
Новый голосовой режим делает общение с ChatGPT ближе к разговору с человеком: речь звучит плавнее, паузы естественнее, и модель лучше понимает изменения интонации. В сочетании с переключением языков ChatGPT может выполнять синхронный устный перевод прямо в ходе диалога — это удобно для международных встреч, поездок и двуязычной практики. Чтобы результат был стабильнее, лучше формулировать запрос конкретно, например: «Переведи на английский более медленным темпом и не перефразируй профессиональные термины».


