En su última ronda de actualizaciones, ChatGPT ha pasado de "saber conversar" a "poder oír, ver y colaborar". Si lo usas habitualmente para escribir, traducir, tomar notas de reuniones o analizar datos, estas nuevas funciones cambiarán notablemente tu flujo de trabajo. A continuación, te explicamos los cambios clave por escenarios de uso.
Actualización multimodal: ChatGPT, más parecido a un "asistente integral"
ChatGPT está adoptando progresivamente GPT-4o como su núcleo de capacidades, centrándose en la multimodalidad: la comprensión de texto, voz e imágenes es más natural. Ahora puedes subir una captura de pantalla para que ChatGPT explique una interfaz, encuentre errores o convierta los datos de un gráfico en conclusiones legibles. Comparado con la antigua necesidad de describir todo mediante texto, el coste de comunicación se reduce.
Modo de voz avanzado: Conversaciones más fluidas y respuestas más humanas
La voz siempre ha sido una entrada muy práctica para ChatGPT. Con el "modo de voz avanzado" en fase de pruebas para algunos usuarios, el realismo y la coherencia han cobrado mayor relevancia. Su valor no radica solo en "poder hablar", sino en que es más adecuado para preguntas continuas, interrupciones instantáneas y debates de varias rondas. Para quienes practican idiomas o necesitan transcripciones orales de reuniones, la usabilidad de ChatGPT ha mejorado notablemente.


