Подписчики ChatGPT Plus недавно получили масштабное обновление — модель GPT-4o официально запущена. По сравнению с предыдущей GPT-4 Turbo, GPT-4o совершила качественный скачок в голосовом взаимодействии, переводе в реальном времени и демонстрации экрана, реализовав настоящий мультимодальный AI. Ниже разберём каждую из этих полезных функций.
Улучшенное голосовое общение и режим разговора
«o» в названии GPT-4o означает omni (универсальный). Модель больше не ограничивается текстовым вводом — она объединяет аудио, видео и текст. Теперь вы можете общаться с ChatGPT Plus голосом: модель распознаёт тон и эмоции, а ответы стали естественнее и плавнее. Обновлённый голосовой режим имеет меньшую задержку, диалог идёт как с живым человеком, без прежней механичности.
На практике — будь то непринуждённая беседа или серьёзная тема — GPT-4o подстраивается под ваш темп и настроение. Такой иммерсивный голосовой интерфейс сильно снижает порог входа, особенно удобно за рулём или во время домашних дел.
Перевод в реальном времени — языковой барьер устранён
Старый ChatGPT тоже умел переводить, но GPT-4o вывела эту возможность на новый уровень. Модель владеет более чем 50 языками и быстро переключается между ними, обеспечивая настоящий синхронный перевод. Будь то рабочее совещание, где нужно понять иностранную речь, или путешествие за границу — GPT-4o распознаёт и переводит на лету.
Я протестировал сценарий перевода с китайского на английский и обратно — задержка практически отсутствует, сохраняются интонация и контекст. Для подписчиков ChatGPT Plus, которым часто приходится общаться на разных языках, эта функция полностью заменяет отдельные переводчики.


