Si vous utilisez récemment l’API Claude pour faire des résumés, écrire du code ou générer de longs textes, le changement le plus évident est qu’elle « peut produire des sorties plus longues », et, en même temps, la console développeur est plus agréable à utiliser. Cet article explique clairement, point par point, plusieurs nouveautés de l’API Claude : comment activer la sortie longue, comment utiliser le Workbench pour évaluer des prompts, et comment comprendre vos dépenses dans le tableau de bord.
Sortie longue de l’API Claude : Sonnet 3.5 passe de 4096 à 8192
L’API Claude a porté la limite maximale de tokens en sortie de Claude Sonnet 3.5 à 8192, mais il faut l’activer explicitement. Lors de l’appel à l’API Claude, ajoutez anthropic-beta dans l’en-tête de la requête pour activer une fenêtre de sortie plus longue, adaptée à la génération en une fois de rapports plus complets, de longs fichiers de code ou de résumés en plusieurs sections.
La syntaxe est très claire : ajoutez à l’en-tête anthropic-beta: max-tokens-3-5-sonnet-2024-07-15. Si, dans l’API Claude, vous rencontrez une « sortie tronquée », commencez par vérifier si vous avez oublié ce commutateur et si votre max_tokens est réglé suffisamment haut.
Workbench plus pratique : générateur de prompts et mode d’évaluation
Dans le Workbench de la console Claude, l’expérience de débogage de l’API Claude s’est enrichie de deux outils clés. Le premier est le « générateur de prompts » : il vous suffit de décrire l’objectif de la tâche (par exemple « classer les demandes entrantes du service client ») et il produira un brouillon de prompt bien structuré, directement copiable dans l’API Claude.
Le second est le « mode d’évaluation » : exécutez côte à côte deux ou plusieurs ensembles de prompts sur le même lot d’entrées ; les sorties sont affichées ensemble pour comparaison, et vous pouvez noter les performances sur une échelle de 5 points. Pour les usages de l’API Claude qui exigent des résultats stables (routage du support, extraction d’informations, réécriture de conformité), cette étape peut réduire nettement les ajustements « au feeling ».


