ChatGPT vient de bénéficier d'une mise à jour majeure avec le lancement officiel du modèle GPT-4o. Le « o » signifie Omni (Omnipotent), indiquant qu'il ne se limite plus au texte, mais intègre des capacités de raisonnement multimodal combinant audio, vidéo et texte. Comparé à la version précédente GPT-4 Turbo, GPT-4o améliore considérablement la fluidité des conversations, la traduction en temps réel et les interactions avec l'IA, offrant aux utilisateurs une expérience plus naturelle et plus chaleureuse.
Conversations fluides et traduction instantanée
Le point fort de GPT-4o réside dans l'évolution complète de l'interaction vocale. Il comprend non seulement le ton et les émotions de l'utilisateur, mais peut également adapter son style de réponse en fonction des exigences de la voix, comme une conversation avec une personne réelle. Par ailleurs, la nouvelle version prend en charge la traduction orale instantanée dans 50 langues, permettant une communication interlinguistique sans avoir recours à des outils tiers. Que ce soit pour une réunion professionnelle ou pour demander son chemin en voyage, il suffit de parler pour que GPT-4o traduise rapidement le contenu dans la langue cible, éliminant ainsi les barrières linguistiques.
Dans un usage quotidien, les utilisateurs peuvent poser des questions vocalement et le modèle analyse en temps réel le contexte pour fournir des réponses teintées d'émotion. Par exemple, en racontant une histoire avant de dormir, il peut imiter différentes voix de personnages pour rendre le récit plus vivant ; lors d'une réunion, il peut jouer le rôle d'un assistant de réunion et enregistrer automatiquement les décisions clés. Cette interaction multimodale élargit considérablement les cas d'utilisation de ChatGPT.
Vision en temps réel et partage d'écran puissants
Les nouvelles capacités visuelles de GPT-4o permettent à l'IA de « voir » le monde. Les utilisateurs peuvent utiliser la caméra ou la fonction de partage d'écran pour que le modèle observe la scène en temps réel et réagisse. Par exemple, lorsque vous rencontrez un bug en codant, il suffit de partager votre écran, et GPT-4o analysera ligne par ligne votre code comme un super prof particulier, en expliquant les erreurs à voix haute. De même, pour le montage vidéo ou la conception graphique, il peut donner des conseils ciblés en fonction du contenu affiché, bien plus efficace que la méthode précédente consistant à décrire des captures d'écran.
De plus, ChatGPT prend désormais en charge le téléchargement direct de fichiers depuis Google Drive et OneDrive. Les utilisateurs peuvent également interagir avec des tableaux et des graphiques, et exporter des diagrammes personnalisés. Cette mise à jour améliore considérablement l'efficacité de l'analyse de données, particulièrement utile pour les professionnels qui traitent fréquemment des rapports.


