En esta actualización, ChatGPT-4o integra más estrechamente las capacidades de texto, voz y visión en el mismo cuadro de diálogo, haciendo que su uso se asemeje más a la comunicación cotidiana. A continuación, desglosamos las novedades de ChatGPT-4o basándonos en experiencias que puedes usar inmediatamente, y te indicamos qué funciones aún se están implementando por fases.
Por qué a ChatGPT-4o se le llama "omnisciente": multimodalidad de una vez
La "o" en ChatGPT-4o proviene de "omni" (omnisciente), y el cambio central es que ya no solo es experto en chatear por escrito, sino que integra la comprensión de texto, imágenes y la interacción por voz en un mismo sistema de razonamiento. Para los usuarios, el beneficio más directo es que puedes usar menos descripciones repetitivas, permitiendo que ChatGPT-4o combine imágenes, archivos o contexto para ofrecer respuestas más completas.
En comparación con el pasado, donde era necesario "enviar texto, luego añadir capturas de pantalla y volver a explicar", ChatGPT-4o enfatiza la comprensión continua y el seguimiento de preguntas dentro de la misma conversación. Escenarios como redacción, tutoría de aprendizaje o resolución de problemas, que requieren aclarar detalles repetidamente, serán notablemente más eficientes en pasos.
Diálogo por voz y traducción instantánea: la comunicación multilingüe se parece más a un "intérprete"
ChatGPT-4o ha mejorado la naturalidad y velocidad de respuesta en los diálogos por voz, con el objetivo de que la conversación se acerque más al ritmo de la comunicación entre personas. Para escenarios multilingües, ChatGPT-4o no solo traduce texto, sino que también prioriza la experiencia de "cambiar rápidamente entre idiomas durante el diálogo", permitiéndote comunicarte de ida y vuelta de manera similar a un servicio de interpretación.
Es importante tener en cuenta que algunas experiencias de voz más avanzadas y realistas pueden implementarse gradualmente según la cuenta y la región; la disponibilidad real dependerá de tu cliente actual. Si deseas probar la traducción, se recomienda configurar directamente "tu rol + dos idiomas + formato de salida" para que ChatGPT-4o mantenga consistentemente las mismas reglas de traducción.


