Titikey
InicioConsejos prácticosGuía de ChatGPTNuevas funciones de ChatGPT: Interacción multimodal GPT-4o y uso práctico de compartir pantalla

Nuevas funciones de ChatGPT: Interacción multimodal GPT-4o y uso práctico de compartir pantalla

6/6/2026
ChatGPT

Para ser honesto, la última actualización de OpenAI para ChatGPT ha sido bastante grande. La apertura completa del modelo GPT-4o ha sorprendido gratamente a muchos usuarios. Como uno de los primeros en probar estas nuevas funciones, quiero hablar sobre varias características que realmente cambian la experiencia de uso, especialmente la interacción multimodal y el compartir pantalla, que claramente han transformado a ChatGPT de un asistente de texto puro a una herramienta verdaderamente versátil.

Interacción multimodal de ChatGPT y función de traducción instantánea

La capacidad multimodal de GPT-4o no se limita simplemente a reconocer imágenes. Su mayor avance está en poder procesar simultáneamente voz, texto y video. Puedes hablarle directamente y es capaz de detectar tu tono y cambios emocionales, respondiendo con un tono más humano. Por ejemplo, si le dices cansadamente "ayúdame a redactar un correo", te responderá con una voz más suave.

Otra mejora práctica es la traducción instantánea. Aunque la versión anterior de ChatGPT ya podía traducir, GPT-4o ahora ofrece interpretación en tiempo real, manejando 50 idiomas, y cambiar de idioma durante una conversación prácticamente sin demora. Probé mezclando chino e inglés y respondió con bastante rapidez.

Comunicación autónoma entre AIs y experiencia de interacción profunda

Lo que más me sorprendió de GPT-4o es que las inteligencias artificiales pueden comunicarse entre sí. Por ejemplo, le pedí que interpretara dos roles distintos con posturas opuestas para debatir, y luego las dejé dialogar una con otra casi sin mi intervención. Este tipo de interacción profunda es especialmente útil para lluvias de ideas: puedes hacer que una AI proponga un plan conservador y otra una estrategia agresiva, y ellas mismas expondrán todas las ventajas y desventajas.

Consejos prácticos de compartir pantalla para resolver problemas de programación

Si escribes código o trabajas con imágenes, compartir pantalla es una función realmente revolucionaria. Antes, cuando encontraba un bug, tenía que copiar y pegar el código o tomar una captura de pantalla y enviarla a ChatGPT. Ahora basta con compartir la pantalla directamente. GPT-4o puede leer en tiempo real el contenido de tu pantalla, incluyendo errores de Python, diseños gráficos e incluso líneas de edición de video. Puedes señalar el problema en la pantalla mientras le preguntas por voz, y él te guiará paso a paso como un tutor particular.

De hecho, la versión de ChatGPT para macOS ya puede editar código directamente en Xcode y VS Code, disponible para usuarios Plus y Pro. Probé escribir una lógica compleja en JavaScript y localizó la modificación directamente en mi archivo del proyecto, ahorrándome muchos problemas de copiar y pegar.

Tutor personal y función accesible de asistencia tecnológica

Muchos usuarios utilizan GPT-4o como un tutor privado uno a uno. Compartes la pantalla de un problema de matemáticas o física, y él te explica paso a paso el proceso de resolución, incluso usando diferentes métodos hasta que lo entiendas. Para usuarios con discapacidad visual, GPT-4o puede describir en tiempo real lo que capta la cámara, por ejemplo: "Hay una silla a tres metros frente a ti, en dirección a tu izquierda". Este tipo de asistencia tecnológica demuestra que la IA no solo es una herramienta de productividad, sino que también puede ser muy reconfortante.

Por supuesto, estas funciones también están disponibles en la versión gratuita, aunque con límites de uso; una vez superados, se vuelve a GPT-3.5. Si tus necesidades diarias son altas, actualizar a ChatGPT Plus será más fluido, ya que puedes enviar hasta 80 mensajes cada tres horas y además usar el modelo de razonamiento más reciente para análisis complejos.

InicioTiendaPedidos