El modelo GPT-4o Omni de OpenAI ha revolucionado la forma en que interactuamos con la inteligencia artificial. La 'o' significa 'Omni' (todopoderoso), lo que convierte a ChatGPT en un asistente que no solo escribe, sino que escucha, ve y habla. Basado en mi experiencia real, me centraré en las dos funciones más prácticas: la conversación por voz y el uso compartido de pantalla, y cómo pueden resolver problemas cotidianos.
Conversación por voz natural y traducción instantánea
Lo que más me impresionó de GPT-4o es su capacidad de conversación por voz extremadamente natural. Reconoce el tono y las emociones de tu voz, e incluso espera pacientemente cuando dudas, sin la rigidez de antes. No es solo un truco: la función de traducción instantánea actualizada admite 50 idiomas y puede realizar comunicación intercultural en tiempo real como un intérprete profesional. Durante una reunión en el extranjero, me salvó de más de un apuro.
Ya sea para contar un cuento antes de dormir a los niños o para actuar como secretario en una reunión, ChatGPT ajusta su tono de voz y vocabulario según tus condiciones emocionales. Para usuarios con barreras idiomáticas o que necesitan compañía, esta experiencia de comunicación antropomórfica era difícil de lograr con tecnologías anteriores, y realmente elimina las brechas de comunicación.
Función de compartir pantalla: tu tutor personalizado
Cuando te atasques escribiendo, programando o editando videos, antes tenías que tomar capturas de pantalla o describir el problema por escrito a ChatGPT, lo cual era muy tedioso. Ahora, con la función de compartir pantalla de ChatGPT, el modelo puede leer directamente el contenido de tu pantalla y analizar el problema que estás tratando. Lo probé una vez: mientras escribía código, encontré un bug; el modelo miró mi pantalla y me guió por voz sobre cómo corregirlo, como si tuviera un tutor superdotado a mi lado.


