El objetivo principal de esta actualización de ChatGPT es claro: evolucionar de "saber conversar" a "poder escuchar, ver y procesar archivos", haciendo el uso diario más fluido. Ya sea para escribir, organizar datos, o para necesidades puntuales como traducción o actas de reuniones, notarás que el flujo de trabajo con ChatGPT se acorta significativamente.
Lanzamiento de GPT‑4o: Conversaciones más naturales, multimodalidad que se asemeja a un "asistente"
En ChatGPT, GPT‑4o se posiciona como un modelo "omni" (completo). Su ventaja no reside solo en el texto, sino en integrar imagen, voz y otras entradas en un mismo sistema de comprensión y razonamiento. Puedes enviar directamente capturas de pantalla o fotos a ChatGPT para que las analice y explique, ahorrando el coste de describirlas.
Al mismo tiempo, la velocidad de respuesta y la coherencia conversacional de ChatGPT se asemejan más a una comunicación real: puedes hacer preguntas de seguimiento sobre un mismo tema de manera más coloquial, y mantendrá el contexto sin necesidad de repetir los antecedentes cada vez.
Voz y traducción instantánea: La comunicación multilingüe se acerca a un "intérprete"
Las capacidades de voz de ChatGPT se están fortaleciendo. El enfoque no es solo "poder hablar", sino lograr una interacción más estable y con un ritmo cercano al diálogo cotidiano. Combinado con la capacidad de cambio de idioma de GPT‑4o, ChatGPT puede alternar rápidamente entre múltiples idiomas, siendo ideal para escenarios como pedir direcciones durante un viaje, colaboración internacional o comunicación con servicio al cliente.
Es importante señalar que algunas funciones de voz avanzadas más realistas se están liberando gradualmente, por lo que la disponibilidad y la experiencia pueden variar entre cuentas.


