ChatGPT получил масштабное обновление: новейшая модель GPT-4o (универсальная модель) теперь полностью доступна. Пользователи могут вести более естественные голосовые диалоги, делиться экраном в реальном времени и редактировать код прямо в инструментах разработки. Эти функции превращают ChatGPT из простого чат-бота в настоящего умного помощника, способного понимать мультимодальную информацию и оказывать поддержку. Как бесплатные, так и платные подписчики могут оценить все эти впечатляющие изменения — в этой статье мы собрали ключевые нововведения.
Мультимодальные возможности GPT-4o: голос, изображения и текст в едином решении
GPT-4o объединяет аудио, видео и текстовые возможности рассуждения в одну универсальную модель. По сравнению с предыдущим поколением GPT-4 Turbo, API GPT-4o работает вдвое быстрее, а стоимость снижена на 50% — реакции практически мгновенные. Пользователи могут не только общаться текстом, но и загружать изображения и файлы для анализа, а также использовать камеру, чтобы ChatGPT в реальном времени описывал окружающую обстановку — это особенно полезно для людей с нарушениями зрения. Два GPT-4o способны даже общаться друг с другом и петь дуэтом, демонстрируя высокий потенциал взаимодействия между ИИ.
Голосовые диалоги стали естественнее: ИИ научился распознавать интонации и эмоции
Голосовой режим в новой версии ChatGPT получил серьезное обновление — теперь общение напоминает разговор с живым собеседником. Модель способна улавливать эмоции, скрытые за интонацией, и реагировать на такие звуки, как дыхание и смех. В обучении GPT-4o действует как настоящий преподаватель: шаг за шагом подводит ученика к решению задачи, а не дает готовый ответ, что значительно повышает эффективность обучения. Кроме того, улучшенная память позволяет ChatGPT запоминать привычки и предпочтения пользователя, предлагая более персонализированные ответы.

