Обзор новых функций ChatGPT: голосовой движок и GPT-4o делают ИИ ещё мощнее

ChatGPT недавно получил ряд значительных обновлений, которые стоит изучить — независимо от того, используете вы его время от времени или полностью полагаетесь на ИИ в творчестве. OpenAI делает ChatGPT более гибким и интеллектуальным: от более естественного голосового взаимодействия до мультимодального понимания. В этом материале собраны ключевые новшества, заслуживающие вашего внимания.

GPT-4o: универсальная мультимодальная модель

Выпуск GPT-4o стал важной вехой в развитии ChatGPT. Модель работает не только с текстом, но и напрямую понимает изображения, аудио и видео. Например, вы можете загрузить эскиз дизайна и попросить советы по улучшению, или записать фрагмент совещания — нейросеть сама создаст краткое содержание. Скорость ответа тоже заметно выросла, общение стало почти как в реальном времени. По сравнению с GPT-4, новая модель стабильнее справляется с рассуждениями и творческими задачами.

Важно: пользователи Plus получают доступ к более высокому уровню интеллекта, а бесплатные пользователи могут неограниченно использовать GPT-5 (с учётом мер защиты от злоупотреблений) в стандартном режиме. Если вы ещё не пробовали мультимодальные возможности GPT-4o, рекомендуйте вручную переключить модель в настройках ChatGPT.

Голосовой движок: клонирование голоса за 15 секунд

Голосовой движок (Voice Engine) от OpenAI делает копирование голоса невероятно простым. Достаточно 15-секундного аудиосэмпла — и система сгенерирует речь, максимально похожую на исходный голос. Функция пригодится не только для персональных голосовых помощников, но и для изучения языков (коррекция произношения) или озвучки контента. Пока инструмент тестируется в отдельных регионах, но уже демонстрирует огромный потенциал.

В сочетании с обновлённым голосовым режимом вы можете общаться с ChatGPT естественной речью без набора текста: задавать вопросы, менять интонацию, вести многораундовые диалоги. Сэм Альтман обещал значительное улучшение качества голоса — на практике он стал действительно более плавным и естественным.

Пользовательские инструкции и обновлённые плагины

Функция пользовательских инструкций позволяет сохранять личные предпочтения на долгое время: стиль ответов, профессиональный контекст, формат вывода. Обновлённая система плагинов интегрируется с Box, Notion, Linear и Dropbox — вы можете читать и записывать документы прямо из ChatGPT. Например, попросить нейросеть сохранить заметки с совещания в Notion или извлечь изображение из Dropbox для анализа — без переключения между приложениями.

Возможности веб-сёрфинга и анализа данных тоже улучшены. ChatGPT теперь точнее извлекает контент по указанным URL, поддерживает загрузку CSV, Excel и других файлов для построения графиков и статистических расчётов. Тем, кто регулярно обрабатывает сложные данные, эти функции помогут сократить ручную работу.

Работа с документами и улучшенная генерация изображений

Понимание документов значительно выросло. Вы можете загружать PDF, Word или текст на изображениях и задавать вопросы: попросить перевести, сделать краткое содержание, извлечь табличные данные. Встроенная функция генерации изображений (на базе DALL·E) тоже обновилась — она лучше понимает запросы и создаёт более точные визуальные работы. Особенно полезно для дизайнеров и контент-мейкеров при быстром мозговом штурме.

В целом, это обновление превращает ChatGPT из простого диалогового помощника в универсальный продуктивный инструмент. Если вы ещё не пробовали голосовой движок или мультимодальное взаимодействие GPT-4o — сейчас отличный момент начать. Не забудьте включить новые плагины в настройках и исследовать все возможности.

GPT-4o: универсальная мультимодальная модель

Голосовой движок: клонирование голоса за 15 секунд

Пользовательские инструкции и обновлённые плагины

Работа с документами и улучшенная генерация изображений

Поиск статей

Подписка ChatGPT Pro | Скидка 30% | Пополнение за 1 минуту | Продление доступно

Spotify Premium на 3 месяца | Пополнение за $10 | Для вашего аккаунта | Без рекламы и офлайн-прослушивание

Популярные Статьи

Несколько лучших подсказок (Prompt) для ChatGPT: способы использования, которые реально повышают эффективность в 10 раз

Claude Code при установке постоянно выдаёт ошибки: пошагово решаем проблему с настройкой за три шага

Чек-лист отладки и KISS‑приёмы для промптов, когда ChatGPT / Claude / Gemini / Midjourney дают сбой

Эффективный рабочий процесс связки ChatGPT + Claude + Gemini с Midjourney: решаем проблему разрозненного стиля и «краха» при правках

ChatGPT и Claude всегда отвечают невпопад: три приёма постановки вопросов, чтобы ИИ мгновенно понял ваши потребности