Este artículo se centra en varias funciones nuevas clave de ChatGPT: la comprensión de voz e imágenes que aporta el modelo multimodal, la importación de archivos desde la nube, la experiencia en escritorio y un control de memoria más transparente. Estas mejoras hacen que ChatGPT vaya más allá de “poder chatear” y se convierta en un asistente de trabajo más práctico. A continuación, lo explicamos por escenarios de uso.
Multimodalidad de GPT-4o: interacción más fluida con texto, voz e imágenes
A medida que GPT-4o se convierte en uno de los modelos centrales de ChatGPT, la experiencia de procesar a la vez texto, voz e imágenes dentro de una misma conversación es más completa. Puedes hacer que ChatGPT entienda el contenido de una imagen y luego preguntar detalles con texto, o cambiar la petición a una explicación oral para comunicarte. Para la escritura cotidiana, la comprensión de tablas y la extracción de información de imágenes, el mayor cambio es que el “coste de explicar ida y vuelta” disminuye de forma notable.
Modo de voz avanzado: más parecido a una conversación, y no a leer un guion
Tras empezar a ofrecerse por tandas a los usuarios el modo de voz avanzado de ChatGPT, la naturalidad, la velocidad de respuesta y la estabilidad de la conversación por voz se han convertido en los principales ejes de mejora. No se limita a leer en voz alta las respuestas de texto, sino que se acerca más al ritmo de una comunicación en tiempo real, ideal para repasar rápidamente un esquema antes de una reunión o para dictar ideas mientras caminas y luego pedir a ChatGPT que las organice. Hay que tener en cuenta que esta función suele habilitarse por fases; su disponibilidad depende de lo que aparezca en la interfaz de tu cuenta.
Importación directa desde Google Drive / OneDrive: un paso menos para el análisis de datos
Al hacer informes o análisis de datos, ChatGPT permite seleccionar y subir archivos directamente desde Google Drive y Microsoft OneDrive, evitando el proceso de descargarlos repetidamente y buscarlos en local. Después de entregar una hoja de cálculo a ChatGPT, puedes seguir preguntando “cómo hacer el gráfico más claro” o “si los criterios son consistentes”, y exportar gráficos personalizados para una presentación. Se recomienda confirmar antes de subirlos que los archivos no contengan campos sensibles, para evitar llevar a la conversación datos que no deberían compartirse.
Función de memoria y nuevos controles: más personalización, y también más control
La función de memoria de ChatGPT ya está disponible para más usuarios en distintas versiones y ha añadido avisos y controles más explícitos: cuando ChatGPT actualiza la memoria, te informará de forma más proactiva de lo que ha ocurrido. Puedes entenderla como un “registro de preferencias con interruptor”, por ejemplo el tono habitual o el contexto de trabajo, pero no es adecuada para guardar contraseñas o números de documentos de identidad. Una práctica más prudente es permitir que ChatGPT recuerde solo el “estilo de escritura / preferencias de formato”, y no contenido privado concreto.
Aplicación de escritorio y uso sin cuenta: menor barrera de entrada, pero con diferencias en la experiencia
La aplicación de macOS de ChatGPT ofrece una forma más rápida de abrirla (por ejemplo, Option + Space) y permite subir archivos y fotos desde el escritorio, además de mantener conversaciones por voz, lo que la hace adecuada para usar ChatGPT como una barra de herramientas siempre disponible. Al mismo tiempo, ChatGPT también ofrece una opción de “uso sin cuenta”, pero con limitaciones en el guardado de conversaciones, la posibilidad de compartir y la capacidad de personalización. Si te importa más un flujo de trabajo continuo y el historial, se sigue recomendando usar la experiencia completa iniciando sesión.