¿Tienes la sensación de que ChatGPT es más útil y fácil de manejar? Es muy probable que no sea una impresión tuya. En las últimas semanas se han implementado una serie de funciones nuevas, centradas principalmente en lograr "conversaciones más naturales", "una comprensión multimodal más potente" y "un procesamiento de archivos con menos pasos". A continuación, te llevamos por el camino más corto para que sepas cómo usar estas actualizaciones y para quién están recomendadas.
GPT-4o ya está aquí: capacidades de texto, imagen y voz más unificadas
La novedad principal de ChatGPT es la transición gradual al modelo GPT-4o (la "o" significa omni, es decir, completo). Este modelo integra las capacidades de texto, imagen y voz en un único sistema de razonamiento, lo que se traduce en respuestas más rápidas y una mejor adaptación a flujos de trabajo en los que se conversa y se edita simultáneamente.
En la práctica, puedes enviar una imagen y hacer preguntas sobre sus detalles en la misma conversación, pidiendo explicaciones, resúmenes o reescrituras sin necesidad de cambiar constantemente de "modo". Si te dedicas a la creación de contenido, redacción de propuestas o edición de textos, notarás una reducción significativa en el esfuerzo de comunicación.
El modo de voz es más natural: mayor velocidad, estabilidad y expresividad en la conversación
Para muchos usuarios, la función más notable es que la conversación por voz ahora se parece más a un "intercambio con una persona real". OpenAI está liberando progresivamente una experiencia de voz más avanzada, destacando una latencia más baja, un reconocimiento más estable y una salida de voz más realista.
Es ideal para situaciones concretas: dictar un esquema mientras caminas, repasar puntos clave antes de conducir, o pedirle que transforme tus ideas en un texto estructurado usando el lenguaje hablado. Si la privacidad es una prioridad para ti, se recomienda verificar los permisos del micrófono y la configuración del historial de conversaciones.


