Si últimamente sientes que ChatGPT “conversa” mejor, entiende mejor las imágenes y se parece más a una herramienta lista para usarse en cualquier momento, no es una ilusión. Con las mejoras en torno a GPT-4o, ChatGPT ha cambiado de forma notable en conversaciones por voz, análisis de archivos y experiencia en escritorio. A continuación, desde una perspectiva más cercana al usuario, explicamos claramente los puntos clave y el uso de estas nuevas funciones de ChatGPT.
GPT-4o hace que ChatGPT entre de verdad en la conversación multimodal
El núcleo de este cambio de experiencia es que ChatGPT pasa a estar impulsado gradualmente por GPT-4o y admite entradas y salidas multimodales como texto, voz e imagen. Para el usuario común, el beneficio más evidente es que, dentro de una misma conversación, puedes enviar texto y también adjuntar imágenes para que ChatGPT incorpore lo que “ve” a su razonamiento y explicación.
En escenarios reales, ChatGPT es más adecuado para “tareas explicativas”, como explicar una imagen, organizar de forma estructurada su contenido o convertir información visual en una lista de acciones. La multimodalidad no equivale a ser todopoderoso, pero permite que ChatGPT pase de ser “un asistente que solo teclea” a una puerta de comunicación más completa.
Modo de voz avanzado: conversaciones más naturales, pero aún en despliegue gradual
El modo de voz avanzado que muchos siguen de cerca apunta a mejorar el realismo, la velocidad y la estabilidad de las respuestas por voz, haciendo que ChatGPT se acerque más al ritmo de una conversación de “escuchar y responder” en tiempo real. Según la información pública, este modo se ofreció en pruebas a un grupo reducido y planea ampliarse de forma gradual, por lo que puede variar si ves o no la opción en tu cuenta.
En el uso, se recomienda tratar a ChatGPT como un socio de “colaboración rápida oral”: plantea la necesidad por voz, añade restricciones, pídele que repita para confirmar y luego que entregue una versión en texto que puedas copiar. Si se trata de información sensible, evita decir por voz directamente números de identificación, tarjetas bancarias o datos privados de clientes, entre otros.
Análisis de archivos más cómodo: permite enviar archivos desde la nube a ChatGPT
Si sueles pedir a ChatGPT que procese hojas de cálculo, informes o archivos de datos, lo más práctico de esta actualización es que ChatGPT permite subir archivos directamente desde Google Drive y Microsoft OneDrive. En comparación con descargarlos primero al equipo y luego subirlos, el proceso es más corto y se adapta mejor cuando el material del equipo está repartido en la nube.


