Si vous utilisez d’habitude Claude via des appels d’API ou que vous peaufinez vos prompts dans la console, vous ressentirez surtout cette mise à jour sur trois points : des réponses plus longues, des réglages plus simples et une facturation plus transparente. Cet article démonte et explique clairement plusieurs nouveautés clés de l’Atelier Claude et de l’API Claude ; il suffit de suivre pour prendre en main.
Sortie longue de Claude Sonnet 3.5 : la bonne façon de passer de 4096 à 8192
Dans l’API Claude, la limite maximale de tokens en sortie de Claude Sonnet 3.5 est passée de 4096 à 8192, ce qui est plus adapté aux résumés longs, à la génération de code et au raisonnement en plusieurs étapes. Pour activer la sortie longue, il faut ajouter un en-tête de requête beta spécifique, et pas seulement modifier max_tokens.
La méthode officielle consiste à ajouter l’en-tête : "anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15". Il est recommandé de n’activer la sortie longue que lorsque Claude doit « terminer un passage entier », afin d’éviter une consommation de tokens inutile.
Générateur de prompts dans l’Atelier : énoncez d’abord la tâche, puis laissez Claude compléter la structure
La console Atelier de Claude ajoute un générateur de prompts, dont l’usage est très simple : vous décrivez d’abord la tâche en une phrase (par exemple : « classer les e-mails entrants du support client et proposer des recommandations de traitement »), et Claude fournira une ossature de prompt plus complète. En général, il ajoute au passage le rôle, les formats d’entrée/sortie, les contraintes et des exemples.
Cette fonctionnalité est particulièrement adaptée au travail en équipe : prenez le prompt généré par Claude comme « modèle de premier jet », puis ajustez-le selon votre terminologie métier — c’est plus fiable que de partir d’une page blanche.


