ChatGPT a récemment bénéficié de plusieurs mises à jour importantes, qu'il s'agisse d'utilisateurs quotidiens ou de créateurs dépendant de l'IA, ces nouvelles fonctionnalités méritent d'être connues. Des échanges vocaux plus naturels à la compréhension multimodale, OpenAI rend ChatGPT plus flexible et plus intelligent. Cet article fait le point sur les nouveautés les plus marquantes.
GPT-4o : le modèle multimodal tout-en-un
Le lancement de GPT-4o constitue une étape clé pour ChatGPT. Il ne se limite pas au texte : il peut directement comprendre des images, des fichiers audio et des vidéos. Par exemple, vous pouvez lui soumettre un croquis de design pour obtenir des suggestions d'amélioration, ou lui envoyer un enregistrement de réunion pour qu'il en génère automatiquement un résumé. La vitesse de réponse de GPT-4o a également été considérablement améliorée, offrant une expérience quasi temps réel. Par rapport à GPT-4, il est plus stable dans les tâches de raisonnement et de créativité.
À noter : les utilisateurs Plus bénéficient d'un niveau de service plus élevé, tandis que les utilisateurs gratuits peuvent utiliser GPT-5 sans limitation en mode intelligence standard (sous réserve des mécanismes anti-abus). Si vous n'avez pas encore testé les capacités multimodales de GPT-4o, il est recommandé de basculer manuellement vers ce modèle dans les paramètres de ChatGPT.
Voice Engine : clonez votre voix en 15 secondes
Le Voice Engine d'OpenAI rend la reproduction vocale extrêmement simple. Il suffit de fournir un échantillon audio de 15 secondes pour que le système génère une sortie vocale très fidèle à cette voix. Cette fonction peut être utilisée pour des assistants vocaux personnels, aider les apprenants en langues à corriger leur prononciation, ou offrir une solution de doublage pratique aux créateurs de contenu audio. Actuellement testée dans certaines régions, elle montre déjà un fort potentiel.
Associé au mode vocal amélioré, vous pouvez désormais discuter avec ChatGPT à l'aide de votre voix naturelle, sans avoir à taper. Vous pouvez poser des questions, ajuster le ton et même mener des conversations à plusieurs tours. Sam Altman avait promis une nette amélioration de la qualité vocale de la nouvelle version, et l'expérience réelle est effectivement plus fluide et naturelle.


