¿Qué novedades trae ChatGPT? Así funciona GPT-4o: conversación multimodal y mayor productividad en escritorio

La actualización de ChatGPT tiene un núcleo claro: poner en práctica las capacidades "omni" (completas) de GPT-4o. No solo escribe texto, sino que también puede escuchar, ver y mantener un diálogo de forma más natural. Para el uso diario, los cambios más evidentes son una comunicación por voz más fluida, una comunicación multilingüe más sencilla y un acceso más rápido desde la aplicación de escritorio.

GPT-4o convierte a ChatGPT en un asistente que "ve y escucha"

El objetivo de GPT-4o es ser "omni" (completo), por lo que ChatGPT ya no se limita a preguntas y respuestas de texto, sino que integra la comprensión de texto, imágenes y audio en un mismo proceso de razonamiento. Puedes subir una imagen o un archivo en medio de una conversación y pedir a ChatGPT que lo explique, organice o analice basándose directamente en su contenido.

En contraste con el pasado, donde tenías que "describir una imagen", ahora muchos problemas se pueden resolver simplemente "mostrándoselos": por ejemplo, tablas, capturas de pantalla o páginas de manuales, permitiendo llegar a una conclusión más rápido.

El chat de voz es más natural: también hace de intérprete casi en tiempo real

La experiencia de voz de ChatGPT se parece más a una conversación que a un "cuadro de entrada de voz", destacando por respuestas más rápidas y un tono más coherente. Algo aún más práctico es el cambio de idioma: en una misma conversación, al alternar entre inglés y español, ChatGPT puede seguir el contexto sin que tengas que repetir la situación.

En escenarios como viajes de negocios, recepción de visitas o reuniones en línea, ChatGPT puede asumir tareas ligeras de interpretación y reformulación instantánea: traduce lo que dice la otra persona al español y luego redacta tu respuesta en un inglés más natural, ahorrando tiempo en el intercambio.

Mayor productividad en la app de escritorio: acceso rápido y manejo de archivos más cómodo

ChatGPT ya ofrece una aplicación de escritorio para macOS. Un uso común es invocarla en cualquier momento con el acceso directo Tecla Option + Espacio, sin necesidad de cambiar constantemente al navegador. También puedes subir archivos, fotos o capturas de pantalla directamente desde la app de escritorio y pedir a ChatGPT que haga resúmenes, extraiga puntos clave o genere listas, lo cual es ideal para procesar adjuntos de correo o documentación de reuniones.

Si sueles resolver problemas "directamente sobre el escritorio", este método de acceso se adapta mejor a tu flujo de trabajo que abrir una pestaña del navegador y copiar-pegar.

Algunas consideraciones al usarlo: límites, cambios y estabilidad de la respuesta

Actualmente, incluso los usuarios gratuitos de ChatGPT pueden utilizar varias capacidades de GPT-4o. Sin embargo, al alcanzar una cierta cuota de uso, el modelo podría volver automáticamente a GPT-3.5. Se recomienda priorizar las tareas que requieren más razonamiento y capacidades multimodales (análisis de archivos, comunicación multilingüe, organización compleja) para la cuota de GPT-4o de ChatGPT.

Además, con archivos o capturas de pantalla que contengan información privada, es más seguro anonimizarlos antes de subirlos. Cuando necesites citar fuentes, también puedes pedir directamente a ChatGPT que indique sus referencias o proporcione enlaces y palabras clave para su verificación.

GPT-4o convierte a ChatGPT en un asistente que "ve y escucha"

El chat de voz es más natural: también hace de intérprete casi en tiempo real

Mayor productividad en la app de escritorio: acceso rápido y manejo de archivos más cómodo

Algunas consideraciones al usarlo: límites, cambios y estabilidad de la respuesta

Buscar artículos

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

ChatGPT: cómo sincronizar la misma cuenta entre web y app (sin perder tus chats al cambiar de dispositivo)

Guía completa de errores de reproducción en Spotify y cómo solucionarlos