OpenAI выпустила два крупных обновления для ChatGPT: мультимодальную модель GPT-4o и интерфейс для совместной работы Canvas. Первая позволяет ИИ по‑настоящему «видеть» и «слышать» мир, второй превращает написание текстов и кода в работу с напарником. Разбираем, как эти функции меняют повседневное использование.
Мультимодальные возможности GPT-4o
Буква «o» в названии GPT-4o означает «omni» (всеобъемлющий) — модель больше не ограничена текстом. Она поддерживает голосовое общение в реальном времени, улавливает тон и эмоции, а также выполняет синхронный перевод: владеет 50 языками — вы говорите по‑русски, а ИИ сразу выдаёт устный перевод на английский. Особенно полезна функция демонстрации экрана: если столкнулись с багом в коде или проблемами в монтаже, достаточно поделиться экраном, и GPT-4o «посмотрит» на ваши действия и даст голосовые подсказки, как опытный репетитор.
Кроме того, GPT-4o обладает возможностью визуального распознавания: через камеру она считывает сцены и помогает людям с ослабленным зрением «услышать» окружение. Всё это превращает ChatGPT из простого чат‑бота в ИИ‑помощника, который видит, слышит и обучает.
Canvas: пишет и кодит вместе с вами, как наставник
Canvas — это отдельное окно для совместной работы, которое полностью меняет привычный диалоговый формат. Когда вы пишете длинный текст или код, Canvas предлагает встроенные комментарии, правки и возможность прямого редактирования. Например, при написании статьи вы можете выделить фрагмент и попросить ИИ улучшить стиль, изменить тон или даже превратить текст в таблицу или стихотворение. При работе с кодом Canvas поддерживает ревью, исправление ошибок и перевод между языками (например, из Python в JavaScript). Все изменения сохраняются в истории версий, и вы можете откатиться в любой момент.


