ChatGPT ha recibido una importante actualización recientemente, y el modelo GPT-4o es la mejora más destacada. Como modelo multimodal completo, GPT-4o incorpora conversaciones de voz en tiempo real, análisis de video y capacidad de reconocimiento de imágenes, transformando completamente la forma en que los usuarios interactúan con la IA. En este artículo desglosamos en detalle estas nuevas funciones de ChatGPT para que puedas sacar el máximo partido a sus últimas características.
Conversación multimodal GPT-4o: integración profunda de voz y video
La mejora central de GPT-4o radica en el fortalecimiento del procesamiento de voz y video. Ya no se limita a la comunicación por texto, sino que puede mantener conversaciones instantáneas como una persona real, reconociendo las emociones del usuario a través del tono y la respiración, por ejemplo, detectando si acabas de hacer ejercicio. Los usuarios también pueden compartir su pantalla para que la IA analice su contenido en tiempo real, especialmente útil en tareas de resolución de problemas o en entornos educativos. Además, GPT-4o admite traducción bidireccional entre inglés y español, con un tono y ritmo naturales que facilitan la comunicación multilingüe.
Análisis visual inteligente y comprensión de imágenes
Una de las funciones más sorprendentes de las nuevas capacidades de ChatGPT es la mejora en el reconocimiento visual. Al tomar una foto y subirla, GPT-4o puede describir el entorno circundante, como identificar utensilios de laboratorio y deducir el contexto profesional, lo cual es de gran ayuda para personas con discapacidad visual o en escenarios educativos. En cuanto a la resolución de problemas matemáticos, el modelo de razonamiento o1 permite subir fotos de exámenes, y la IA proporciona un paso a paso para llegar a la solución, en lugar de dar la respuesta directamente, siendo especialmente útil para problemas complejos como cálculo diferencial.
Mejoras de rendimiento y optimización para escritorio
OpenAI ha mejorado la velocidad y la calidad de respuesta de GPT-4o en esta actualización, reduciendo el costo de las llamadas API hasta en un 50%, lo que resulta muy favorable para desarrolladores y empresas. Además, la aplicación de escritorio ChatGPT para Mac permite activar la IA en cualquier momento con el atajo Option+Espacio, sin necesidad de abrir el navegador. Los usuarios de la versión gratuita también pueden probar GPT-4o, aunque con un límite de uso, y al superarlo se degrada automáticamente a GPT-3.5. Estas nuevas funciones de ChatGPT merecen ser descargadas y probadas.