Titikey
InicioConsejos prácticosGuía de ChatGPTAnálisis de las nuevas funciones de ChatGPT: Modo de voz avanzado e interacción multimodal completamente renovados

Análisis de las nuevas funciones de ChatGPT: Modo de voz avanzado e interacción multimodal completamente renovados

6/6/2026
ChatGPT

ChatGPT ha recibido varias actualizaciones recientes. El modo de interacción por voz se ha optimizado por completo, y las capacidades multimodales del modelo GPT-4o elevan la experiencia del usuario a otro nivel. Olvídate de los mensajes de texto fríos: ahora ChatGPT se siente más como un compañero inteligente que entiende el tono y analiza imágenes. A continuación, repasamos los cambios más destacados que merecen atención.

Voz más natural: ritmo y entonación casi humanos

La nueva función avanzada de voz ha ajustado significativamente la entonación y el ritmo, eliminando esa sensación robótica y rígida de antes. Ahora permite cambiar de idioma en medio de una conversación, por ejemplo, traducción simultánea entre chino e inglés, lo que facilita la comunicación intercultural. Para quienes necesitan reunirse con colegas en el extranjero o aprender un idioma, es como tener un intérprete personal siempre disponible.

En el futuro, este modo de voz se integrará aún más en el modo "Projects", creando flujos de trabajo más inmersivos. Imagina que solo hablas y ChatGPT te ayuda a organizar el progreso del proyecto o a generar un borrador de informe con voz, sin necesidad de escribir nada.

GPT-4o abre una nueva forma de interacción: pantalla compartida y análisis en tiempo real

El lanzamiento de GPT-4o es lo más destacado de esta actualización. Ya no se limita a texto, sino que admite procesamiento combinado de audio, video y texto. Ahora puedes compartir la pantalla de tu ordenador o móvil con ChatGPT para que vea lo que estás haciendo y te dé consejos. Por ejemplo, si te quedas atascado escribiendo código, ChatGPT analiza directamente el fragmento de código en tu pantalla y te explica con voz dónde está el error.

Esta función es especialmente potente al manejar contenido multimedia: puede capturar imágenes de un video y analizarlas. Antes tenías que describir el problema por escrito; ahora ChatGPT lee la imagen directamente y responde al instante a tus preguntas de voz, como si un experto te guiara paso a paso.

Combinado con Projects: flujos de trabajo de voz personalizados

ChatGPT está experimentando la integración del modo de voz con Projects. La función Projects permite a los usuarios crear proyectos propios y recordar el contexto. Con la interacción por voz, puedes decirle a ChatGPT: "Revisa los puntos clave de la reunión de hoy", y automáticamente accederá a los datos del proyecto y te responderá con voz.

Este diseño hace que la voz ya no sea solo para preguntas y respuestas, sino que conecta todo el flujo de trabajo. Ya sea para hacer análisis de mercado o para organizar apuntes de estudio, la interacción por voz vuelve el proceso más intuitivo. Esta oleada de actualizaciones realmente aumenta la utilidad de ChatGPT en escenarios profesionales. Los usuarios de pago no deberían perderse estas nuevas funciones.

InicioTiendaPedidos