GPT-4o lleva a ChatGPT de ser un asistente que solo "sabe escribir" a un compañero de trabajo que puede escuchar, ver y procesar información mientras conversas. El cambio más directo es una conversación más natural, un cambio entre tareas más rápido y unas capacidades multimodales más completas. A continuación, te explicamos las nuevas funciones de GPT-4o con varios escenarios que podrás usar inmediatamente.
Qué es GPT-4o: Integrando texto, voz y visión
La "o" en GPT-4o significa "omni" (todopoderoso). La mejora central es la integración del razonamiento de texto, audio y visión en un único modelo. No necesitas cambiar entre modos constantemente; muchas tareas se pueden realizar directamente en GPT-4o. Para el usuario cotidiano, la sensación más evidente es que GPT-4o responde más rápido y sus diálogos se asemejan más a una conversación humana.
Traducción en tiempo real con GPT-4o: La comunicación multilingüe se convierte en "traducir mientras hablas"
Ya podías usar ChatGPT para traducir antes, pero GPT-4o enfatiza más el cambio instantáneo "conversacional": dentro de un mismo chat puedes cambiar rápidamente entre idiomas sin tener que copiar y pegar repetidamente. Al combinar esto con el diálogo por voz, GPT-4o se acerca más a la experiencia de un intérprete simultáneo, ideal para comunicaciones en reuniones, preguntar direcciones durante un viaje o confirmaciones temporales en colaboraciones internacionales.
GPT-4o analiza imágenes y lee archivos: Funciona como un asistente personal
GPT-4o permite subir imágenes y archivos, haciendo que la instrucción "mira esta imagen/esta tabla" sea algo común. Puedes enviarle informes, material de presentaciones o capturas de pantalla y pedirle que identifique anomalías, resuma puntos clave o genere extractos que puedas copiar directamente en un correo electrónico.


