Esta actualización integra voz, imagen y memoria en ChatGPT con GPT-4o, transformándolo de un simple chat a una herramienta de uso cotidiano. A continuación, desglosamos las nuevas funciones de ChatGPT según los escenarios más frecuentes.
GPT-4o combina texto, imágenes y audio en una sola conversación
El enfoque de GPT-4o es "omni" (todo en uno), y para ChatGPT el cambio más notable es una multimodalidad más fluida: en la misma conversación, puedes ingresar texto, subir imágenes y archivos, permitiendo que ChatGPT lea el contenido directamente y realice inferencias, en lugar de solo describirlo superficialmente.
Si sueles usar ChatGPT para organizar información, esta integración ahorra pasos significativos: capturas de pantalla, tablas y PDFs no requieren conversión previa a texto; puedes enviarlos directamente a ChatGPT para extraer puntos clave, comparar diferencias o generar listas, reduciendo el esfuerzo de comunicación.
Voz avanzada y traducción instantánea: Usa ChatGPT como intérprete personal
La interacción por voz de ChatGPT se asemeja más a una conversación natural: puedes ajustar tus solicitudes mientras hablas, y ChatGPT responde con mayor rapidez, sin esperar a que "termine de procesar" cada frase. Al mezclar idiomas en la conversación, ChatGPT permite cambios rápidos y ofrece traducciones casi instantáneas al estilo de un intérprete.
Para quienes realizan reuniones internacionales, puedes pedir a ChatGPT que repita frases con distintos tonos o traduzca lenguaje hablado a versiones formales para correos; para estudiantes, puede corregir pronunciación, ofrecer sinónimos y ejemplos, facilitando una práctica más coherente.


