Если вам кажется, что ChatGPT стал удобнее и «послушнее», скорее всего, это не иллюзия. Недавно одна за другой начали выходить новые функции ChatGPT — с акцентом на «более естественный диалог», «более сильное мультимодальное понимание» и «обработку файлов с меньшим числом шагов». Ниже — самый короткий путь, чтобы понять, как использовать эти обновления и кому они подходят.
Запуск GPT‑4o: возможности текста, изображений и голоса стали более едиными
Самая ключевая новая функция ChatGPT в этот раз — постепенный переход модели по умолчанию на GPT‑4o (o означает omni, «всеобъемлющий/универсальный»). Он объединяет возможности работы с текстом, изображениями и голосом в единой системе рассуждений: в целом ответы становятся быстрее, а рабочий процесс «общаться и сразу править» — удобнее.
На практике вы можете отправить картинку и тут же уточнять детали, а он в рамках одного и того же диалога объяснит, подытожит или перепишет — без необходимости постоянно «переключать режим». Если вы делаете контент, пишете предложения/планы или правите тексты, заметно снизятся издержки на коммуникацию.
Голосовой режим стал естественнее: выше скорость диалога, стабильность и выразительность
Для многих пользователей самая ощутимая новая функция ChatGPT — то, что голосовой диалог стал больше похож на «общение с живым человеком». Официально также постепенно открывают более продвинутый голосовой опыт, делая упор на меньшую задержку, более стабильное распознавание и более реалистичный голосовой вывод.
Подходящие сценарии довольно конкретны: надиктовать план на ходу, быстро проговорить ключевые пункты перед выездом на машине или в разговорной форме попросить его «превратить мысли в структурированный текст». Если для вас важна приватность, сначала проверьте разрешения микрофона и настройки хранения истории диалогов.


