Esta actualización de Claude API se centra principalmente en resolver tres cosas: respuestas más largas, depuración más rápida y costes más transparentes. A continuación, siguiendo el recorrido más habitual de los desarrolladores, desgloso las nuevas funciones de Claude API y aporto puntos clave de uso que puedes copiar tal cual.
Salida extendida de Claude API: Sonnet 3.5 duplica la salida máxima
En Claude API, el límite máximo de tokens de salida de Claude Sonnet 3.5 se ha incrementado de 4096 a 8192, lo que lo hace adecuado para resúmenes más largos, generación de código e instrucciones de varios pasos. Para habilitar la salida extendida, es necesario añadir en la solicitud el encabezado beta especificado.
El método es muy directo: al llamar a Claude API, añade el encabezado anthropic-beta: max-tokens-3-5-sonnet-2024-07-15 y configura max_tokens con el valor que necesites. Se recomienda definir también una estructura de salida clara (por ejemplo, por puntos, por secciones, campos JSON); de lo contrario, que sea más largo no necesariamente será más legible.
Actualización del Workbench de la consola: el generador de prompts es más adecuado para “redactar rápido”
El Workbench de la consola de Claude incorpora un generador de prompts: basta con describir la tarea en una frase (por ejemplo, “clasificar y procesar solicitudes entrantes de soporte al cliente”) y te ofrecerá una plantilla de prompt más completa. Para quienes suelen escribir instrucciones de system y necesitan estandarizar el formato de salida, esta función ahorra muchas iteraciones de prueba y error.
Un uso más práctico es: primero, deja que el generador produzca una versión “ejecutable”, y luego incorpora tus restricciones reales, como validación de campos, manejo de fallos (fallback), longitud de salida y estilo de lenguaje. Por último, vuelve a volcar el prompt final en el system de Claude API o en la primera instrucción de user, y listo.
Modo de evaluación: antes de usar Claude API, compara prompts con una pasada
El modo de evaluación del Workbench permite comparar en paralelo las salidas de dos o más prompts y puntuar los resultados con una escala de 5 puntos. Es especialmente útil para pruebas A/B de “misma tarea, distintas redacciones”: por ejemplo, para extraer campos, uno orientado a la robustez y otro a la concisión.


