Los suscriptores de ChatGPT Plus acaban de recibir una actualización importante con el lanzamiento del modelo GPT-4o. En comparación con el anterior GPT-4 Turbo, GPT-4o ofrece avances cualitativos en interacción por voz, traducción en tiempo real y uso compartido de pantalla, brindando una experiencia de IA verdaderamente multimodal. A continuación, analizamos una por una estas nuevas funciones prácticas.
Conversación natural y mejora del modo de voz
La "o" de GPT-4o significa "omni" (todoterreno). Ya no se limita a la entrada de texto, sino que integra capacidades de razonamiento con audio, video y texto. Ahora puedes hablar directamente con ChatGPT Plus, y el modelo es capaz de percibir el tono y las emociones, respondiendo de forma más natural y fluida. El modo de voz actualizado tiene una latencia mucho menor, haciendo que las conversaciones sean tan continuas como una charla real, eliminando esa sensación robótica que había antes.
En la práctica, tanto si estás charlando casualmente como discutiendo temas serios, GPT-4o ajusta su estilo de respuesta según tu velocidad al hablar y tu estado de ánimo. Esta interacción de voz inmersiva reduce enormemente la barrera de uso, siendo ideal para cuando conduces o haces tareas domésticas.
Traducción en tiempo real que rompe las barreras lingüísticas
La versión anterior de ChatGPT ya permitía traducir, pero GPT-4o lleva esta capacidad a un nuevo nivel. Domina más de 50 idiomas y puede cambiar rápidamente entre ellos, ofreciendo una verdadera interpretación en tiempo real. Ya sea que necesites entender una intervención en otro idioma durante una reunión de trabajo o quieras comunicarte sin problemas con locales cuando viajas al extranjero, GPT-4o puede realizar el reconocimiento de voz y la traducción al instante.
Probé el escenario de traducción entre chino e inglés, y la respuesta fue casi sin latencia, conservando además los matices de tono y contexto. Para los usuarios de ChatGPT Plus que necesitan comunicarse en varios idiomas con frecuencia, esta función elimina directamente la necesidad de aplicaciones de traducción adicionales.


