В этой статье за один раз объясняются самые практичные недавние изменения в ChatGPT: от мультимодальных диалогов и продвинутого голоса до настольного клиента для Mac и прямого подключения файлов из облачного диска. Вам не нужно построчно перечитывать объявления об обновлениях — достаточно сопоставить их со своими сценариями использования, чтобы быстро понять, какие функции стоит попробовать сразу. В конце также будут перечислены различия в возможностях ChatGPT при разных состояниях аккаунта, чтобы избежать подводных камней.
Мультимодальное обновление: ChatGPT больше похож на «умеет видеть и понимать на слух»
После выхода GPT-4o мультимодальный опыт в ChatGPT стал заметно более цельным: в рамках одного и того же диалога он может обрабатывать текст, понимать содержимое изображений и давать рекомендации. Для обычных пользователей самое очевидное изменение — стало проще «спрашивать по картинке»: сделайте скриншот фрагмента с ошибкой, сфотографируйте таблицу или изображение товара — и ChatGPT сможет рассуждать и объяснять, опираясь прямо на изображение. Если вы часто занимаетесь контентом, учёбой или поиском ошибок, такие возможности будут экономить больше времени, чем просто переписка.
Продвинутый голосовой режим: диалог естественнее, но доступ открывают поэтапно
Продвинутый голосовой режим, которого многие ждут, отличается более реалистичными голосовыми ответами и взаимодействием, больше похожим на разговор в реальном времени, однако сейчас он открывается постепенно лишь части пользователей. Если в ChatGPT вы видите обновлённый вход в голосовой режим, обычно это означает, что ваш аккаунт уже получил новую версию в рамках поэтапного развёртывания. Поскольку голосовые функции связаны с проверками надёжности и безопасности, сроки появления полного набора возможностей могут различаться в зависимости от региона и аккаунта — ориентируйтесь на то, что отображается в клиенте ChatGPT.


