Claude 3.5 : Nouvelles fonctionnalités de contrôle d'ordinateur et d'amélioration du codage

Anthropic vient de déployer une mise à jour majeure de Claude 3.5 Sonnet, bien plus qu'une simple retouche : l'IA est désormais capable d'interagir directement avec un ordinateur. Concrètement, Claude peut voir votre écran, déplacer la souris et même taper du texte. Parallèlement, le tout nouveau modèle Claude 3.5 Haiku fait son apparition à une vitesse fulgurante, avec des performances remarquables sur plusieurs benchmarks. Cette mise à jour ouvre un champ des possibles tant pour les développeurs que pour les utilisateurs ordinaires.

Claude 3.5 Sonnet : utiliser un ordinateur comme un humain

Le point fort de cette mise à jour est la nouvelle capacité de contrôle d'ordinateur de Claude 3.5 Sonnet. Anthropic a développé une API dédiée qui permet à Claude de percevoir les pixels de l'interface écran et d'interagir avec elle à la manière d'un humain. Les développeurs peuvent intégrer cette API pour que Claude exécute des tâches multi-étapes comme « ouvrir le navigateur, se connecter à la messagerie, envoyer un e-mail ». Sur le benchmark OSWorld, Claude 3.5 Sonnet a obtenu un score de 14,9 % en ne se basant que sur des captures d'écran, loin devant le deuxième.

Bien entendu, cette fonctionnalité est encore en phase de test : Claude a encore des progrès à faire sur des actions précises comme le défilement ou le glisser-déposer. Par exemple, il peut interrompre une tâche lors d'un enregistrement long. Mais plusieurs entreprises, dont Canva et DoorDash, ont déjà commencé à tester cette fonctionnalité de Claude pour automatiser des processus répétitifs, comme Replit qui l'utilise pour construire des agents capables de vérifier automatiquement des applications.

Amélioration spectaculaire du codage : des performances de pointe dans le secteur

Outre le contrôle d'ordinateur, les capacités de codage de Claude 3.5 Sonnet ont fait un bond qualitatif. Son score sur SWE-bench Verified est passé de 33,4 % à 49,0 %, dépassant ainsi de nombreux modèles publics, y compris certains modèles de raisonnement spécialisés. Les tests de GitLab montrent que la nouvelle version de Claude offre un raisonnement plus puissant pour les tâches DevSecOps sans augmenter la latence.

Cela signifie que les développeurs peuvent désormais confier plus sereinement des tâches complexes de développement logiciel multi-étapes à Claude. Sur un autre test d'évaluation des compétences en programmation, HumanEval, Claude 3.5 Sonnet a atteint 93,7 %, avec une capacité nettement améliorée à traiter des problèmes logiciels réels. Pour ceux qui collaborent fréquemment avec l'IA pour écrire du code, cette mise à jour de Claude apporte un véritable gain de productivité.

Claude 3.5 Haiku : le meilleur équilibre entre vitesse et intelligence

En parallèle de Claude 3.5 Sonnet, le nouveau modèle rapide Claude 3.5 Haiku fait son entrée. Son principal atout réside dans son coût et sa vitesse, comparables à ceux de la génération précédente, mais avec un niveau d'intelligence bien supérieur, rivalisant même avec le précédent modèle phare Claude 3 Opus. En matière de codage, Claude 3.5 Haiku a obtenu un score de 40,6 % sur SWE-bench Verified, surpassant de nombreux modèles dont GPT-4.

Du point de vue du positionnement produit, Claude 3.5 Haiku est particulièrement adapté aux applications temps réel sensibles à la latence, comme les produits orientés utilisateur, les tâches de sous-agents ou les services nécessitant la génération d'expériences personnalisées à partir de grandes quantités de données. Si vous avez des exigences élevées en matière de rapidité de réponse sans vouloir trop sacrifier l'intelligence, ce nouveau modèle constitue un choix très rentable.

Claude 3.5 Sonnet : utiliser un ordinateur comme un humain

Amélioration spectaculaire du codage : des performances de pointe dans le secteur

Claude 3.5 Haiku : le meilleur équilibre entre vitesse et intelligence

Rechercher des articles

Articles Populaires

Les meilleurs prompts (instructions) pour ChatGPT : des usages qui peuvent vraiment multiplier l’efficacité par 10

L’installation de Claude Code échoue toujours ? Tutoriel pas à pas : 3 étapes pour régler les problèmes de configuration

Checklist de dépannage et astuces KISS pour éviter les ratés dans les sorties de ChatGPT, Claude, Gemini et Midjourney

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

Guide complet des codes d'erreur Spotify et solutions

Claude 3.5 : Nouvelles fonctionnalités de contrôle d'ordinateur et d'amélioration du codage

Claude 3.5 Sonnet : utiliser un ordinateur comme un humain

Amélioration spectaculaire du codage : des performances de pointe dans le secteur

Claude 3.5 Haiku : le meilleur équilibre entre vitesse et intelligence

Rechercher des articles

Articles Populaires

Les meilleurs prompts (instructions) pour ChatGPT : des usages qui peuvent vraiment multiplier l’efficacité par 10

L’installation de Claude Code échoue toujours ? Tutoriel pas à pas : 3 étapes pour régler les problèmes de configuration

Checklist de dépannage et astuces KISS pour éviter les ratés dans les sorties de ChatGPT, Claude, Gemini et Midjourney

ChatGPT Claude Gemini加Midjourney联动的高效工作流 解决输出不统一和改稿崩溃

Guide complet des codes d'erreur Spotify et solutions

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃