ChatGPT-4o lleva al modelo de lenguaje más allá del texto, transformándolo en un asistente que puede escuchar, ver y comunicarse de forma más natural. La "o" significa "omni" (omnisciente), y su cambio central es la integración de capacidades de texto, audio y visión en un único sistema de razonamiento. A continuación, te explicamos sus principales mejoras según escenarios de uso reales.
Multimodalidad unificada: ChatGPT-4o no solo escribe, también "ve"
ChatGPT-4o ya no se limita a preguntas y respuestas de texto, sino que integra la comprensión de imágenes y la interacción por voz en el mismo flujo de conversación. Puedes proporcionarle capturas de pantalla, fotos o contexto con menos explicaciones, para que los analice combinando lo visual con el texto. En comparación con el antiguo método de "describir largo y tendido para que lo adivine", esta experiencia multimodal se acerca más a la comunicación cotidiana.
Traducción en tiempo real y voz natural: la comunicación multilingüe se siente como una charla
La traducción siempre ha sido un punto fuerte de ChatGPT, pero ChatGPT-4o enfatiza el "cambio instantáneo dentro de la conversación". Soporta un cambio rápido entre múltiples idiomas, ideal para actuar como intérprete en reuniones, viajes o colaboraciones internacionales. Junto con el diálogo por voz, ChatGPT-4o puede responder, traducir y profundizar en los detalles con un ritmo más natural, reduciendo el tiempo que dedicas a copiar y pegar textos.
Compartir pantalla y asistencia laboral: conecta ChatGPT-4o con tu problema en directo
Al trabajar con código, edición de video, hojas de cálculo o errores de software, antes solía ser necesario capturar la pantalla, anotar y describir el proceso. El enfoque de ChatGPT-4o es hacer la obtención de información más "in situ": comprendiendo lo que estás haciendo al leer el contenido que compartes de tu pantalla y ofreciendo sugerencias por voz o texto de manera simultánea. Se parece más a un asistente conversacional disponible al instante, en lugar de uno que solo espera en un cuadro de texto a que le prepares los materiales.
Función de memoria y opciones de control: puede recordar, y también olvidar cuando quieras
La memoria es un elemento clave en la experiencia de ChatGPT-4o: puede adaptar sus respuestas futuras a tu estilo de escritura, contexto laboral o formatos habituales, basándose en las preferencias que revelas durante la conversación. Lo más importante es que la memoria no es obligatoria; puedes gestionar en la configuración cómo se utilizan los "recuerdos almacenados" y el "historial de chat", con opciones para desactivar, revisar o eliminar. Cuando necesites una conversación completamente sin rastro, también puedes usar el chat temporal para evitar que se guarde en la memoria.
Disponible en la versión gratuita, pero entiende el sistema de límites de uso
Actualmente, los usuarios de ChatGPT, incluso sin pagar, pueden experimentar las capacidades centrales de ChatGPT-4o, incluido el análisis multimodal y de archivos, pero estarán sujetos a límites de uso. Después de alcanzar un cierto volumen, el sistema podría cambiar automáticamente a un modelo más básico para permitirte continuar. Para una experiencia estable con ChatGPT-4o, se recomienda concentrar las tareas de mayor valor en una misma conversación, reduciendo así el consumo generado por repetir el contexto.