Фокус этого обновления ChatGPT предельно ясен: с помощью GPT‑4o объединить текстовые, голосовые и визуальные возможности в рамках одного диалога. Для повседневных пользователей ChatGPT становится больше похож на «помощника по первому требованию», а не на инструмент, где можно лишь задавать вопросы в формате набора текста.
«Универсальный» диалог GPT‑4o: текст, голос и изображения вместе
Буква o в GPT‑4o происходит от omni («универсальный»): это означает, что ChatGPT больше не специализируется только на тексте, а объединяет звук, изображение и текстовые рассуждения в одном рабочем процессе. В рамках одного и того же диалога можно попросить ChatGPT посмотреть картинку, прочитать файл, а затем более естественным способом объяснить всё вам. По сравнению со старыми моделями такая мультимодальная интеграция снижает издержки переключения и делает темп общения более плавным.
Более плавное голосовое взаимодействие + мгновенный перевод: проще работать между языками
Голосовой режим ChatGPT стал ближе к живому общению: вы можете сразу уточнять, перебивать, добавлять условия — ChatGPT будет следовать контексту. Перевод тоже больше не сводится к «перевести кусок текста»: поддерживается быстрое переключение между языками, что подходит для общения в формате синхронного устного перевода. Для командировок, встреч или онлайн‑сотрудничества мгновенный перевод ChatGPT заметно сокращает количество уточнений туда‑сюда.


