OpenAI ha lanzado GPT-4o, el primer modelo que logra una interacción verdaderamente "omnicomprensiva"; la "o" significa omni (todo). A diferencia de modelos anteriores, GPT-4o puede procesar simultáneamente texto, voz y video, haciendo que el diálogo con la IA sea tan natural como una conversación real. Tanto los usuarios gratuitos como los suscriptores de ChatGPT Plus pueden acceder a estas nuevas funciones.
Traducción en tiempo real y diálogo natural: rompiendo barreras idiomáticas
GPT-4o admite interpretación instantánea en más de 50 idiomas, con una latencia casi nula al cambiar de lengua. Antes solo se podía traducir escribiendo; ahora, basta con hablar al teléfono para obtener traducciones inmediatas, algo especialmente útil durante viajes de trabajo o estudios en el extranjero. Además, la fluidez de las conversaciones por voz ha mejorado drásticamente: el modelo percibe el tono y las emociones del usuario, y sus respuestas ya no son mecánicas, sino que tienen un matiz emocional adecuado. Por ejemplo, si preguntas en tono de broma, responderá con un estilo relajado.
Compartir pantalla y tutor inteligente: soluciones más visuales
Cuando te encuentres con un error de programación o un problema de edición, solo tienes que activar el uso compartido de pantalla. GPT-4o puede "ver" directamente tu interfaz, analizarla y guiarte con instrucciones de voz al mismo tiempo. Esto es mucho más eficiente que tener que describir el problema por escrito o enviar capturas. También puede actuar como tutor personal, ofreciendo razonamientos paso a paso en materias como matemáticas o ciencias, ayudando a comprender conceptos complejos. Si eres suscriptor de ChatGPT Plus, además puedes usar el modelo o1-preview para problemas más avanzados.


