За последний год ChatGPT от OpenAI представил удивительные итерации функций, от мультимодального взаимодействия до глубоких рассуждений, и каждое обновление направлено на преобразование пользовательского опыта. В этой статье мы систематизируем эти ключевые новые функции, раскрывая, как ChatGPT эволюционировал из текстового чат-бота в более универсального и умного повседневного помощника.
Универсальная модель GPT-4o: начало новой эры мультимодального взаимодействия
Одним из самых важных обновлений ChatGPT является выпуск модели GPT-4o. Буква "o" означает "omni" (универсальный), что указывает на способность модели бесшовно интегрировать возможности рассуждения для текста, аудио и визуальных данных. Это обеспечивает естественный, почти человеческий опыт общения, с очень быстрым временем отклика, а также пониманием и генерацией эмоциональной речи.
Его функция перевода в реальном времени поддерживает более 50 языков и может работать как эффективный устный переводчик. Более практичной является возможность совместного использования экрана: когда вы сталкиваетесь с проблемами в программировании или использовании программного обеспечения, достаточно поделиться экраном, и ChatGPT сможет "увидеть" проблему и предоставить голосовые инструкции, как супер-репетитор по вызову.
Беспроблемная интеграция: десктопный клиент и сотрудничество с Apple
Чтобы сделать взаимодействие более удобным, ChatGPT выпустил официальный десктопный клиент. В macOS пользователи могут просто нажать Option+пробел, чтобы мгновенно вызвать ChatGPT без открытия браузера, обеспечивая истинный доступ в любое время. Приложение поддерживает прямую загрузку локальных файлов, изображений и голосовые диалоги.
Кроме того, глубокое сотрудничество OpenAI с Apple интегрирует возможности ChatGPT в Siri и на уровне операционной системы. В будущем пользователи устройств Apple смогут напрямую использовать интеллектуальные функции на базе GPT-4o без необходимости в учетной записи, что значительно снижает порог входа и делает ИИ-помощника повсеместным.


