La actualización más importante reciente de ChatGPT tiene como núcleo a GPT-4o (donde la "o" representa "omni", es decir, "todas"). Este modelo integra capacidades de texto, voz e imagen en una misma conversación, transformando a ChatGPT de un simple "asistente que escribe" a una herramienta multimodal que puede ver, escuchar y explicar. A continuación, basándonos en la experiencia práctica, desglosamos las nuevas funciones más valiosas para empezar a usar inmediatamente.
GPT-4o: Conversaciones más fluidas y naturales
La ventaja de GPT-4o se nota primero en que el "costo de la comunicación" es menor: ante una misma pregunta, las respuestas de ChatGPT son más rápidas y su tono es más natural. Puedes hacer solicitudes de manera más coloquial, por ejemplo, "reescribe este párrafo con un tono más amigable", y ChatGPT a menudo lo logra al primer intento. La mejora es muy evidente para tareas que requieren confirmaciones frecuentes, como modificar textos, estructurar propuestas o explicar conceptos.
Traducción de voz en tiempo real: Comunicación multilingüe sin interrupciones
La traducción siempre ha sido un punto fuerte de ChatGPT, pero GPT-4o se acerca más a un modelo de "interpretación instantánea": puede cambiar rápidamente entre idiomas y, combinado con el diálogo por voz, reduce la carga de tener que escribir. Escenarios comunes incluyen conversaciones durante viajes de negocios, confirmaciones inmediatas en reuniones en idiomas extranjeros o la transcripción en tiempo real de un dictado en chino a puntos clave en inglés. También puedes pedirle a ChatGPT que use un glosario de términos y un tono específicos (formal/informal) para que las traducciones sean más consistentes.
Multimodalidad más práctica: Comprende imágenes, archivos e incluso el contenido de la pantalla
GPT-4o no solo lee texto, sino que también razona combinando imágenes y archivos: puedes enviarle directamente capturas de pantalla con mensajes de error, anomalías en tablas o la lógica de una presentación para que te las explique. Un uso más avanzado es la "solución de problemas compartiendo pantalla": cuando te quedas estancado escribiendo código, editando video o trabajando en una hoja de cálculo, puedes organizar la información clave de tu pantalla actual y dársela a ChatGPT. Él analizará y dará sugerencias operativas paso a paso, ahorrando el tiempo de estar haciendo capturas de pantalla y explicando una y otra vez.
Creación personalizada y tutoría de aprendizaje: Múltiples versiones según tus necesidades
GPT-4o es más hábil aceptando "requisitos personalizados", como especificar el público objetivo, el tono, la extensión o incluso pedirle que guíe de manera progresiva, como un tutor. Al usar ChatGPT como un tutor personal, puedes pedirle que primero plantee un problema, luego haga preguntas de seguimiento según tu respuesta y corrija tu razonamiento con ejemplos que puedas entender. Lo mismo aplica para la creación de contenido: para un mismo texto, ChatGPT puede ofrecerte tres estructuras de borrador final listas para usar: una versión para e-commerce, otra para redes sociales y otra para correo electrónico.
Accesibilidad y recordatorios: Gratuito, pero atento a los límites de uso
Actualmente, los usuarios gratuitos de ChatGPT también pueden experimentar varias capacidades de GPT-4o. Sin embargo, cuando se alcanza el límite de uso en un período corto, el modelo puede cambiar automáticamente a una versión más básica (por ejemplo, GPT-3.5). Por otro lado, la aplicación de escritorio de ChatGPT hace que el acceso sea más conveniente: en Mac, por ejemplo, puedes usar un atajo de teclado para abrir una conversación, reduciendo la distracción de cambiar constantemente de ventana del navegador. Si vas a subir archivos o capturas de pantalla, se recomienda verificar primero que el contenido no contenga datos sensibles antes de entregárselo a ChatGPT para mayor tranquilidad.