OpenAI представила модель GPT-4o, где «o» означает Omni (всеобъемлющий). Это значит, что ChatGPT больше не ограничен текстовым общением — теперь он объединяет аудио, видео и логические рассуждения. Благодаря обновлению ChatGPT бесплатные пользователи тоже могут пользоваться мультимодальным взаимодействием.
Реальный перевод устраняет языковые барьеры
Новая модель GPT-4o владеет 50 языками и быстро переключается между ними. В сочетании с более плавным диалогом ChatGPT теперь способен на устный перевод в реальном времени — будь то деловые встречи или путешествия, кросс-культурное общение становится намного проще. Эта новая функция ChatGPT переводит естественнее, чем старая версия, а точность распознавания речи значительно выросла.
Демонстрация экрана помогает с программированием и монтажом
Раньше при ошибках в коде или проблемах с монтажом приходилось описывать их текстом или делать скриншоты. Теперь GPT-4o может напрямую считывать содержимое с демонстрируемого экрана, одновременно анализируя и отвечая голосом — как опытный репетитор. В реальном тесте на поиск ошибок Python от момента показа экрана до получения исправления прошло менее 30 секунд.


