OpenAI presentó el modelo GPT-4o, donde la “o” significa omni (omnipotente), lo que implica que ChatGPT ya no se limita a la comunicación escrita, sino que integra capacidades de razonamiento con audio, video y texto. Esta actualización de funciones de ChatGPT permite que incluso los usuarios gratuitos disfruten de interacciones multimodales.
Traducción en tiempo real para eliminar barreras lingüísticas
El nuevo modelo GPT-4o domina 50 idiomas y puede cambiar rápidamente entre ellos. Combinado con una función de conversación más fluida, ChatGPT ahora puede realizar interpretación simultánea, ya sea en reuniones de negocios o viajes, haciendo que la comunicación entre idiomas sea mucho más sencilla. Esta nueva capacidad de ChatGPT es más natural que la versión anterior de traducción, y la precisión del reconocimiento de voz también ha mejorado significativamente.
Compartir pantalla para resolver problemas de programación y edición
Antes, ante errores de código o problemas de edición, era necesario escribir o capturar pantalla para describirlos. Ahora, GPT-4o puede leer directamente el contenido de la pantalla compartida, analizarlo y responder por voz al mismo tiempo, como un tutor profesional. En pruebas reales, al usarlo para localizar errores de sintaxis en Python, desde compartir la pantalla hasta recibir sugerencias de corrección, todo el proceso tomó menos de 30 segundos.


