La actualización de ChatGPT tiene un núcleo claro: poner en práctica las capacidades "omni" (completas) de GPT-4o. No solo escribe texto, sino que también puede escuchar, ver y mantener un diálogo de forma más natural. Para el uso diario, los cambios más evidentes son una comunicación por voz más fluida, una comunicación multilingüe más sencilla y un acceso más rápido desde la aplicación de escritorio.
GPT-4o convierte a ChatGPT en un asistente que "ve y escucha"
El objetivo de GPT-4o es ser "omni" (completo), por lo que ChatGPT ya no se limita a preguntas y respuestas de texto, sino que integra la comprensión de texto, imágenes y audio en un mismo proceso de razonamiento. Puedes subir una imagen o un archivo en medio de una conversación y pedir a ChatGPT que lo explique, organice o analice basándose directamente en su contenido.
En contraste con el pasado, donde tenías que "describir una imagen", ahora muchos problemas se pueden resolver simplemente "mostrándoselos": por ejemplo, tablas, capturas de pantalla o páginas de manuales, permitiendo llegar a una conclusión más rápido.
El chat de voz es más natural: también hace de intérprete casi en tiempo real
La experiencia de voz de ChatGPT se parece más a una conversación que a un "cuadro de entrada de voz", destacando por respuestas más rápidas y un tono más coherente. Algo aún más práctico es el cambio de idioma: en una misma conversación, al alternar entre inglés y español, ChatGPT puede seguir el contexto sin que tengas que repetir la situación.
En escenarios como viajes de negocios, recepción de visitas o reuniones en línea, ChatGPT puede asumir tareas ligeras de interpretación y reformulación instantánea: traduce lo que dice la otra persona al español y luego redacta tu respuesta en un inglés más natural, ahorrando tiempo en el intercambio.


