ChatGPT ha lanzado una serie de actualizaciones prácticas centradas en GPT-4o que mejoran la fluidez del diálogo e integran voz, imágenes y análisis de archivos en un solo flujo de trabajo. Este artículo resume las funciones más destacadas para que decidas cuáles probar primero.
Capacidad "omni" de GPT-4o: integración de texto, imágenes y razonamiento
El objetivo de GPT-4o es ser "omni", es decir, hacer que ChatGPT no solo sea bueno con el texto, sino que integre la comprensión visual y el razonamiento en un mismo modelo. Puedes enviar directamente capturas de pantalla, fotos o gráficos a ChatGPT para que primero interprete el contenido y luego ofrezca sugerencias paso a paso, en lugar de solo dar descripciones genéricas.
En la experiencia práctica, las respuestas de ChatGPT se sienten más como un diálogo: son más rápidas, usan frases más cortas y está más dispuesto a preguntar por detalles clave. Este cambio, que lo hace "más conversacional", es notable en tareas que requieren confirmaciones repetidas, como la escritura, la comunicación sobre productos o la depuración de código.
Traducción simultánea y diálogo por voz: una comunicación multilingüe más natural
Con GPT-4o, ChatGPT ha mejorado la experiencia de voz y traducción, permitiendo cambiar rápidamente entre varios idiomas, lo que se acerca más a un "intérprete en tiempo real". Si necesitas alternar entre idiomas en reuniones, servicio al cliente o viajes de negocios, dejar que ChatGPT mantenga el mismo contexto para las traducciones ahorrará esfuerzo.
Además, el modo de voz avanzado de ChatGPT se está implementando y perfeccionando gradualmente, destacándose por respuestas de voz más realistas y una experiencia de conversación más estable. Puedes usarlo como un asistente de voz "al que se puede interrumpir y hacer preguntas de seguimiento", no como una herramienta tradicional de voz a texto.
Mejoras en el análisis de archivos y datos: carga directa desde la nube con menos pasos
Al trabajar con informes o organizar datos, ChatGPT ahora permite subir archivos directamente desde Google Drive y Microsoft OneDrive, eliminando el paso de descargar localmente y volver a subir. Una vez cargado, puedes pedir a ChatGPT que lea tablas, haga resúmenes, identifique valores atípicos e incluso genere ideas para gráficos útiles en presentaciones.
Si usas ChatGPT con frecuencia para explicar datos, se recomienda proporcionar de una vez "el contexto del problema + el formato de salida deseado", por ejemplo, "presenta tres conclusiones clave y un párrafo de advertencia sobre riesgos". Así, ChatGPT producirá de manera más consistente contenido reutilizable.
Productividad en escritorio: acceso rápido, búsqueda en historial y perspectivas de compartir pantalla
La aplicación de escritorio de ChatGPT para macOS ofrece un acceso más intuitivo: con Option + Espacio puedes invocar la ventana para hacer preguntas en cualquier momento, sin cambiar al navegador. La versión de escritorio también admite la carga de archivos e imágenes, haciendo que ChatGPT se sienta más como una estación de trabajo portátil que como un chat web.
En cuanto a la experiencia de uso, ChatGPT está incorporando gradualmente la búsqueda en el historial de chats para recuperar conversaciones anteriores más rápido. Combinado con la dirección futura de "compartir video/pantalla" del modo de voz avanzado, será más fluido manejar errores o seguir pasos en una interfaz. Incluso si no compartes la pantalla, enviar una captura de pantalla de la interfaz clave a ChatGPT puede ofrecer una eficiencia de diagnóstico casi equivalente.
Un dato adicional: actualmente, los diferentes tipos de cuenta de ChatGPT con GPT-4o pueden tener límites de uso variables. Los usuarios gratuitos, al alcanzar cierta cuota, pueden volver automáticamente a un modelo más básico. Se recomienda concentrar las tareas de alto valor durante el acceso a GPT-4o y usar modos más ligeros para preguntas menores del día a día.