ChatGPT a récemment bénéficié d'une série de mises à jour majeures, des capacités multimodales de GPT-4o à l'intégration des modèles de raisonnement de la série o, rendant cet assistant IA encore plus polyvalent. Que vous soyez un utilisateur quotidien ou un créateur professionnel, ces nouvelles fonctionnalités peuvent améliorer votre productivité et votre expérience d'interaction. Cet article décortique ces changements notables un par un.
GPT-4o mis à niveau : des interactions multimodales plus naturelles
GPT-4o, le modèle phare polyvalent d'OpenAI, est désormais accessible à tous les utilisateurs, y compris ceux de la version gratuite et de la version Plus. Il ne se limite plus au texte, mais intègre désormais le traitement de la voix, des images et des vidéos. Par exemple, vous pouvez prendre une photo pour que GPT-4o identifie les objets dans la scène, ou télécharger un PDF pour qu'il analyse les données.
Ce qui surprend le plus, c'est le mode vocal : la latence des interactions a été considérablement réduite, donnant l'impression de discuter avec une vraie personne. GPT-4o peut également détecter votre état émotionnel grâce au ton de votre voix et ajuster ses réponses pour plus d'empathie. Si vous ne l'avez pas encore essayé, vous pouvez l'utiliser pour pratiquer une langue étrangère à l'oral ou aider vos enfants à faire leurs devoirs de maths.
Les modèles de raisonnement o3 et o4-mini officiellement disponibles
OpenAI a lancé les modèles o3 et o4-mini, conçus spécifiquement pour le raisonnement complexe et l'analyse approfondie. o3 est capable de « penser avec des images », en combinant des outils Python pour traiter des éléments visuels, idéal pour les tâches avancées comme la recherche académique ou le raisonnement logique. o4-mini, quant à lui, mise sur l'efficacité : il offre une rapidité de réponse nettement améliorée tout en maintenant une qualité de raisonnement élevée.

