Это обновление связало вокруг GPT‑4o голос, изображения и память, превратив ChatGPT из «умеет общаться» в «удобно пользоваться на ходу». Ниже — разбор новых функций ChatGPT по самым распространённым сценариям.
GPT‑4o объединяет текст, изображения и аудио в одном диалоге
Позиционирование GPT‑4o — «всеобъемлющий (omni)», и для ChatGPT самое заметное изменение — более гладкая мультимодальность: в рамках одной беседы можно и вводить текст, и загружать изображения и файлы, чтобы ChatGPT напрямую прочитал содержимое и затем рассуждал, а не ограничивался поверхностным описанием.
Если вы привыкли использовать ChatGPT для систематизации материалов, такая интеграция заметно сокращает число шагов: скриншоты, таблицы и PDF не нужно заранее превращать в чистый текст — просто отправьте их в ChatGPT, чтобы он извлёк ключевые пункты, сравнил различия или сформировал список; стоимость коммуникации становится ниже.
Продвинутый голос и мгновенный перевод: используйте ChatGPT как карманного устного переводчика
Голосовое взаимодействие ChatGPT стало больше похоже на обычный разговор: вы можете говорить и по ходу уточнять требования, а ChatGPT способен быстрее подхватывать реплики — не нужно ждать, пока он «додумает» каждую фразу. При переключении языков в ходе диалога ChatGPT поддерживает быстрый переход и может выполнять перевод в формате устного переводчика, близкий к реальному времени.
Для тех, кто часто участвует в международных встречах, можно попросить ChatGPT переформулировать одну и ту же фразу с разной интонацией или перевести разговорную речь в более официальный вариант письма; а учащимся он может помочь выстроить подход к исправлению произношения, дать синонимические замены и примеры, чтобы практика была более связной.


