ChatGPT получил масштабное обновление: от мультимодальных возможностей GPT-4o до моделей рассуждений серии o, что сделало этого ИИ-помощника ещё более универсальным. Независимо от того, пользуетесь ли вы им ежедневно или создаёте профессиональный контент, новые функции помогут повысить продуктивность и улучшить взаимодействие. В этой статье разберём самые заметные изменения.
GPT-4o: полное обновление – более естественное мультимодальное взаимодействие
GPT-4o, флагманская универсальная модель OpenAI, теперь доступна всем пользователям – как бесплатной версии, так и версии Plus. Она больше не ограничивается текстом, а объединяет обработку речи, изображений и видео. Например, вы можете сфотографировать объект, и GPT-4o определит его на снимке, или загрузить PDF, чтобы модель помогла проанализировать данные.
Самое впечатляющее – режим голосового диалога. Задержка взаимодействия значительно снижена, и общение напоминает разговор с живым человеком. GPT-4o также может определять ваше эмоциональное состояние по тону голоса и давать более эмпатичные ответы. Если вы ещё не пробовали, можно попросить её помочь с практикой иностранного языка или объяснить ребёнку математику.
Модели рассуждений o3 и o4-mini официально запущены
OpenAI выпустила модели серии o3 и o4-mini, специально разработанные для сложных рассуждений и глубокого анализа. o3 способна «думать с помощью изображений», используя инструменты Python для обработки визуальных элементов, что подходит для решения задач академических исследований и логических выводов. o4-mini, в свою очередь, ориентирована на высокую эффективность: она значительно ускоряет ответы, сохраняя качество рассуждений.

