Если в последнее время вам кажется, что ChatGPT стал «разговорчивее», лучше «видит» изображения и всё больше похож на инструмент, который всегда под рукой, — это не иллюзия. На фоне обновлений вокруг GPT-4o в ChatGPT заметно изменились голосовые диалоги, анализ файлов и опыт использования на десктопе. Ниже, с точки зрения пользователя, разберём ключевые новые функции ChatGPT и как ими пользоваться.
GPT-4o действительно вводит ChatGPT в эру мультимодального общения
Суть этих изменений в том, что ChatGPT постепенно начинает работать на GPT-4o и поддерживает мультимодальные входы и выходы — текст, голос, изображения и т. д. Для обычных пользователей самый очевидный плюс в том, что в рамках одного диалога можно одновременно отправлять текст и прикреплять картинки, чтобы ChatGPT включал «увиденное» в рассуждения и объяснения.
В реальных сценариях ChatGPT лучше подходит для «объяснительных задач»: например, пояснить изображение, структурированно разобрать содержимое картинки, превратить визуальную информацию в список действий. Мультимодальность не означает всесильность, но она превращает ChatGPT из «помощника, который умеет только печатать», в более полноценную точку входа для коммуникации.
Продвинутый голосовой режим: более естественный диалог, но всё ещё открывается постепенно
Продвинутый голосовой режим, которым интересуются многие, нацелен на повышение реалистичности, скорости и стабильности голосовых ответов, чтобы ChatGPT был ближе к ритму «слушает и отвечает на ходу». Согласно открытой информации, этот режим ранее давали в тестовый доступ небольшому числу пользователей и планируют постепенно расширять доступ, поэтому наличие пункта в вашем аккаунте может отличаться.
В использовании стоит воспринимать ChatGPT как партнёра для «быстрой устной совместной работы»: голосом сформулировать запрос, добавить ограничения, попросить пересказать для подтверждения, а затем получить от ChatGPT текстовую версию, которую можно копировать. Когда речь о чувствительных данных, лучше не диктовать напрямую номер паспорта, банковской карты, клиентские персональные данные и т. п.
Анализ файлов стал удобнее: поддерживается отправка файлов в ChatGPT прямо из облака
Если вы часто поручаете ChatGPT обработку таблиц, отчётов или данных, то самое практичное в этом обновлении — поддержка загрузки файлов напрямую из Google Drive и Microsoft OneDrive. По сравнению со схемой «сначала скачать на компьютер, потом загрузить», шагов меньше, а также это удобнее, когда командные материалы разложены по облачным дискам.


