ChatGPT Plus недавно получил масштабное обновление — мультимодальные возможности на базе модели GPT-4o были полностью расширены. Новые функции не только улучшают качество диалога, но и добавляют такие практичные опции, как совместный доступ к экрану и перевод в реальном времени. Независимо от того, разработчик вы или обычный пользователь, вы почувствуете, как AI-помощник меняет работу и учёбу. Ниже мы подробно разберём все заслуживающие внимания нововведения.
Мультимодальное взаимодействие: глубокое слияние голоса и зрения
Главная особенность модели GPT-4o — интеграция обработки аудио, видео и текста. Пользователи ChatGPT Plus теперь могут вести более естественные голосовые беседы: модель улавливает интонацию и подстраивает стиль ответа. Более того, GPT-4o поддерживает функцию демонстрации экрана — пользователь может показывать код, диаграммы или окна с ошибками, а AI в реальном времени анализирует и предлагает решения, избавляя от необходимости переключаться между набором текста и скриншотами.
Функция мгновенного перевода также впечатляет — GPT-4o владеет 50 языками и умеет быстро переключаться между ними. Межъязыковое общение стало предельно простым: будь то совещание или личный разговор, вы получаете почти реальный синхронный перевод. Кроме того, новая функция позволяет AI-моделям общаться друг с другом, помогая пользователям глубже сравнивать и анализировать информацию.
Новые сценарии совместной работы в реальном времени: секретарь на собраниях и репетитор
Благодаря мультимодальности GPT-4o может выполнять роль секретаря на совещаниях. Он понимает содержание встречи, записывает ключевые моменты и формирует краткие отчёты, значительно повышая продуктивность. В образовательных сценариях GPT-4o превращается в персонального AI-наставника: помогает решать учебные задачи в реальном времени, например, объясняет математику или программирование. Такое интерактивное обучение, напоминающее работу с репетитором, делает учёбу проще и увлекательнее.


