Ces derniers temps, les mises à jour de ChatGPT ont un objectif clair : transformer un simple chatbot en un outil capable d'écouter, de voir et de traiter des fichiers. Des conversations vocales plus naturelles aux raccourcis bureau pratiques, en passant par l'importation directe depuis le cloud, ChatGPT s'intègre désormais plus étroitement dans les flux de travail quotidiens.
Le mode vocal ressemble à une vraie conversation : plus rapide, stable et expressif
OpenAI a commencé à déployer progressivement un mode vocal avancé pour certains utilisateurs, rendant les réponses vocales de ChatGPT plus réalistes et attentives au rythme et aux pauses. Vous pouvez l'utiliser pour des discussions orales, idéales pour réfléchir en marchant, établir des plans en conduisant, ou simuler rapidement des questions-réponses avant une réunion. Pour ceux qui communiquent dans différentes langues, ChatGPT, avec sa traduction instantanée, offre une expérience proche d'un interprète personnel.
Du texte à l'audio et à la vidéo : les capacités multimodales de ChatGPT deviennent plus pratiques
Basé sur l'approche multimodale de GPT-4o, ChatGPT ne traite plus seulement le texte, mais intègre la compréhension du texte, des images et de l'audio dans une même conversation. Vous pouvez télécharger des images pour que ChatGPT explique le contenu, aide à décrire des scènes, ou exprimer vos besoins vocalement avant de générer un plan écrit. OpenAI a également mentionné publiquement le développement de capacités vidéo, mais le déploiement se fera par étapes ; il est donc prudent d'attendre que les fonctionnalités soient disponibles.


