После появления GPT‑4o в ChatGPT самые заметные изменения — «умеет говорить, умеет видеть и лучше работает с файлами». В этом материале с точки зрения реального использования быстро разберём, что именно обновилось в GPT‑4o у ChatGPT и какими функциями вы уже можете пользоваться.
Что такое GPT‑4o: ChatGPT движется к «универсальному» взаимодействию
«o» в GPT‑4o — от omni, то есть более универсальные мультимодальные возможности: понимание и рассуждение над текстом, изображениями и голосом объединены в одной модели. Для пользователей ChatGPT ощутимые улучшения — более высокая скорость ответа, более связные диалоги и более естественное переключение между задачами.
Если вы часто используете ChatGPT для конспектирования, письма или вопросов‑ответов, заметите, что он охотнее уточняет потребности, раскладывает шаги и объясняет понятнее. Особенно в сценариях, где нужно «обсуждать и сразу править», GPT‑4o больше похож на «напарника, который всегда на связи».
Голос и мгновенный перевод: ChatGPT больше похож на реальный разговор
GPT‑4o делает голосовые диалоги в ChatGPT ближе к повседневному общению: вы можете описывать проблему более разговорно и получать более плавные ответы. Важно учитывать, что более «реалистичный» расширенный голосовой режим — функция, которую открывают постепенно; часть пользователей получит доступ раньше.
В переводе ChatGPT не только переводит текст, но и лучше умеет быстро переключаться между языками — это подходит для импровизированного устного перевода, межъязыкового общения и практики иностранных языков. Вы можете прямо сказать ChatGPT: «Дальше отвечай попеременно на китайском и английском», и он обычно стабильно держит ритм.


