ChatGPT недавно представил серию крупных обновлений, от глубокой модернизации основной модели до оптимизации пользовательского опыта. Эти новые функции меняют правила игры в области человеко-машинного взаимодействия. Будь то многомодальное понимание новой «универсальной» модели GPT-4o или удобство расширенного голосового режима и эксклюзивного настольного приложения — всё это свидетельствует о том, что ChatGPT становится как никогда мощным и простым в использовании.
GPT-4o: начало новой эры многомодального взаимодействия
«o» в GPT-4o означает «omni» (универсальный), что знаменует собой фундаментальный скачок. Модель больше не ограничивается обработкой текста, а глубоко интегрирует возможности обработки аудио, визуальных данных и текста в режиме реального времени. По сравнению с предыдущими версиями, GPT-4o демонстрирует значительный прогресс в плавности диалога, понимании контекста и креативности ответов.
Это означает, что вы можете вести естественные беседы с помощью голоса, загружать изображения или файлы для анализа и даже делиться экраном, чтобы получать инструкции в реальном времени для решения задач по программированию или дизайну. Это похоже на универсального помощника, сочетающего в себе переводчика, репетитора и творческого партнера. Некоторые из этих функций уже доступны бесплатным пользователям.
Расширенный голосовой режим: погружающий диалог, почти неотличимый от человеческого
ChatGPT постепенно развертывает более продвинутую и реалистичную голосовую функцию для части пользователей подписки Plus. Этот новый голосовой режим призван обеспечить эмоциональный, естественный по интонациям диалог с чрезвычайно низкой задержкой ответа, создавая ощущение разговора с реальным человеком.
Несмотря на задержки, связанные со спорами о тембре голоса, тестирование и оптимизация этой функции продолжаются. Это не просто преобразование речи в текст и обратно, а прямое понимание и генерация звука, тона и эмоций самой моделью. Это открывает новые возможности для таких сценариев, как образовательное сопровождение и создание контента.


