La gran novedad de la última actualización de ChatGPT es GPT-4o (o de “omni”, todo en uno). Integra texto, voz y comprensión visual en una misma capacidad de razonamiento, haciendo que ChatGPT no solo “responda”, sino que se parezca más a “conversar” y “colaborar”. A continuación, te resumimos las nuevas funciones más destacadas y los escenarios donde mejor se aplican.
Qué mejora realmente GPT-4o: de asistente de texto a modelo todoterreno
Con GPT-4o, ChatGPT puede comprender y generar texto, audio e imágenes al mismo tiempo, sin necesidad de ir cambiando entre modos. El cambio más evidente para el usuario es que, dentro de una misma conversación, puedes mezclar voz, escritura y envío de imágenes, y aun así ChatGPT mantiene el contexto de forma coherente. Frente al enfoque anterior más de “preguntas y respuestas”, ahora se prioriza una “interacción en tiempo real”.
Conversación por voz más natural y traducción en tiempo real: comunicación multilingüe más fluida
En la conversación por voz, las respuestas de ChatGPT se sienten más cercanas a una charla real: con un ritmo más natural y una mejor adaptación a tu tono. La traducción no se limita a cambiar frases de un idioma a otro, sino que permite alternar rápidamente entre varios idiomas. Es útil para pedir indicaciones en un viaje, hacer interpretación improvisada en reuniones internacionales o escuchar una entrevista y organizar las ideas mientras la sigues. Para resultados más estables, conviene indicar desde el inicio el idioma objetivo y el contexto (por ejemplo: “interpreta al japonés en un estilo más coloquial”).

