Las nuevas funciones de ChatGPT: GPT-4o multimodal, mejoras de voz y carga directa desde la nube

¿Tienes la sensación de que ChatGPT es más útil y fácil de manejar? Es muy probable que no sea una impresión tuya. En las últimas semanas se han implementado una serie de funciones nuevas, centradas principalmente en lograr "conversaciones más naturales", "una comprensión multimodal más potente" y "un procesamiento de archivos con menos pasos". A continuación, te llevamos por el camino más corto para que sepas cómo usar estas actualizaciones y para quién están recomendadas.

GPT-4o ya está aquí: capacidades de texto, imagen y voz más unificadas

La novedad principal de ChatGPT es la transición gradual al modelo GPT-4o (la "o" significa omni, es decir, completo). Este modelo integra las capacidades de texto, imagen y voz en un único sistema de razonamiento, lo que se traduce en respuestas más rápidas y una mejor adaptación a flujos de trabajo en los que se conversa y se edita simultáneamente.

En la práctica, puedes enviar una imagen y hacer preguntas sobre sus detalles en la misma conversación, pidiendo explicaciones, resúmenes o reescrituras sin necesidad de cambiar constantemente de "modo". Si te dedicas a la creación de contenido, redacción de propuestas o edición de textos, notarás una reducción significativa en el esfuerzo de comunicación.

El modo de voz es más natural: mayor velocidad, estabilidad y expresividad en la conversación

Para muchos usuarios, la función más notable es que la conversación por voz ahora se parece más a un "intercambio con una persona real". OpenAI está liberando progresivamente una experiencia de voz más avanzada, destacando una latencia más baja, un reconocimiento más estable y una salida de voz más realista.

Es ideal para situaciones concretas: dictar un esquema mientras caminas, repasar puntos clave antes de conducir, o pedirle que transforme tus ideas en un texto estructurado usando el lenguaje hablado. Si la privacidad es una prioridad para ti, se recomienda verificar los permisos del micrófono y la configuración del historial de conversaciones.

Carga directa de archivos y desde la nube: análisis de datos sin rodeos

Otra función muy práctica es la posibilidad de importar archivos directamente desde Google Drive y Microsoft OneDrive para su análisis. Para tareas con hojas de cálculo, informes o gráficos, ya no es necesario descargarlos primero al dispositivo y luego subirlos, lo que hace el flujo mucho más fluido.

Una vez importado, puedes pedirle que resuma datos, identifique anomalías, sugiera ideas para gráficos o incluso compile los resultados en una lista de puntos lista para incluir en un informe. Si el archivo contiene información sensible, se recomienda anonimizarla antes de subirlo.

Aplicación de escritorio y acceso rápido: convierte ChatGPT en una herramienta a mano

ChatGPT también está mejorando la experiencia en escritorio, ofreciendo formas de uso más cercanas a "tenerlo siempre disponible", como accesos directos por teclado, carga directa de archivos e imágenes desde el escritorio, o búsqueda rápida en el historial. El valor de estas funciones reside en reducir la interrupción de tener que cambiar constantemente al navegador.

Si sueles escribir código, planificar tareas de operaciones o necesitas editar textos sobre la marcha, te recomendamos crear plantillas con tus indicaciones habituales. Usarlas junto con la aplicación de escritorio te ahorrará tiempo.

GPT-4o ya está aquí: capacidades de texto, imagen y voz más unificadas

El modo de voz es más natural: mayor velocidad, estabilidad y expresividad en la conversación

Carga directa de archivos y desde la nube: análisis de datos sin rodeos

Aplicación de escritorio y acceso rápido: convierte ChatGPT en una herramienta a mano

Buscar artículos

Suscripción ChatGPT Pro | 30% de descuento | Recarga en 1 minuto | Renovación disponible

Spotify Premium 3 meses | Recarga de $10 | Para tu propia cuenta | Sin anuncios y reproducción offline

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

Flujo de Trabajo Eficiente: Integra ChatGPT, Claude, Gemini y Midjourney para Coherencia y Menos Estrés en Revisiones

3 Técnicas para Hacer Preguntas Efectivas a ChatGPT y Claude y Obtener Respuestas Precisas