El enfoque de esta actualización de ChatGPT es muy claro: pasar de “solo poder chatear escribiendo” a un banco de trabajo que puede ver, oír, hablar y también procesar archivos directamente. En torno a las capacidades multimodales de GPT‑4o, ChatGPT ha mejorado de forma notable en fluidez conversacional, traducción en tiempo real, invocación en escritorio y análisis de archivos. A continuación, con unos cuantos cambios que podrás usar de inmediato, te lo explico rápidamente.
GPT‑4o hace que ChatGPT se parezca más a un “asistente todoterreno”
El posicionamiento de GPT‑4o es “omni”, es decir, todoterreno: ChatGPT ya no solo destaca en texto, sino que integra la comprensión de texto, imágenes y voz en un mismo sistema de razonamiento. En la experiencia real, ChatGPT responde más rápido y la conversación fluye mejor; especialmente en escenarios en los que necesitas mirar mientras explicas, se ahorran pasos. Para la mayoría de usuarios, esta mejora no es un botón concreto, sino “menos cambios de herramienta, menos copiar y pegar de ida y vuelta”.
Traducción en tiempo real y conversación por voz: ChatGPT puede “interpretar” de forma más natural
Antes, la traducción en ChatGPT era “tú envías una frase y él responde otra”; ahora GPT‑4o pone más énfasis en el cambio inmediato en estilo conversacional, adecuado para la comunicación bilingüe y la interpretación in situ. Con el modo de voz, ChatGPT puede alternar más rápido entre distintos idiomas, reduciendo la sensación de tirones. Cabe tener en cuenta que algunas experiencias de voz más avanzadas se irán habilitando por fases, y la velocidad a la que estén completas puede variar según la cuenta y la región.


