Titikey
InicioConsejos prácticosClaudeNovedades de julio en la API de Claude: Guía sobre Sonnet 3.5 y el límite de salida duplicado

Novedades de julio en la API de Claude: Guía sobre Sonnet 3.5 y el límite de salida duplicado

4/2/2026
Claude

¿Qué problemas resuelve esta actualización de la API de Claude?

La actualización de la API de Claude en julio de 2024 se centra en Claude Sonnet 3.5: ofrece capacidades mejoradas, un rendimiento más estable en velocidad y costos, y completa la experiencia de desarrollo. Para los equipos que necesitan generar contenido extenso, procesar por lotes y visualizar costos, esta mejora es inmediatamente aplicable.

Si antes te encontrabas con limitaciones en la longitud de la salida, inconsistencia en la calidad de los prompts o dificultades para rastrear el consumo, esta actualización proporciona soluciones oficiales.

Lanzamiento de Claude Sonnet 3.5: Más potente pero mantiene el costo de un modelo de nivel medio

La API de Claude ya ofrece Claude Sonnet 3.5. Anthropic destaca en sus anuncios que esta es su "versión más reciente", superando en múltiples evaluaciones a modelos de la competencia e incluso a Claude Opus 3, mientras mantiene la velocidad y el posicionamiento de costo de un modelo de nivel medio. Para aplicaciones diarias (clasificación de soporte, resúmenes, escritura, asistencia en código), cambiar a Sonnet 3.5 a menudo reduce directamente el trabajo de reprocesamiento.

Al implementarlo, se recomienda hacer primero una prueba A/B en la API de Claude con el mismo conjunto de prompts: evalúa la consistencia de la salida, la factualidad y el seguimiento del formato, antes de decidir cambiar completamente.

Salida máxima aumentada de 4096 a 8192 tokens: Cómo habilitarlo en la API de Claude

El límite máximo de tokens de salida para Claude Sonnet 3.5 en la API se ha duplicado, de 4096 a 8192, pero requiere habilitación explícita. El método oficial es incluir este encabezado en la solicitud: anthropic-beta: max-tokens-3-5-sonnet-2024-07-15, y luego establecer el parámetro `max_tokens` al valor deseado.

Esto es especialmente útil para resúmenes largos, generación de informes y autocompletado de código extenso: reduces la necesidad de "continuaciones", el retraso general es más controlable y es menos probable que la conversación se desvíe en diálogos de múltiples turnos.

Generador de prompts en Workbench: Delega la creación de prompts a la herramienta

Entre las mejoras de Workbench en Claude Console, se añadió un "generador de prompts". Solo describes la tarea (ej. "clasificar solicitudes entrantes de soporte al cliente") y genera un prompt más estructurado y reutilizable, ideal para convertir experiencia individual en estándares de equipo.

Se recomienda usar Workbench para finalizar los prompts antes de ponerlos en producción en la API: define formatos fijos de entrada/salida, agrega condiciones de límite y luego cópialos. Esto reduce notablemente el costo de iteración de prompts.

Actualizaciones de costos y documentación: Desarrollo más manejable y con más recursos

Esta actualización también incluye un nuevo panel de uso y costos, que facilita revisar el consumo de la API de Claude por tiempo y volumen, permitiendo calcular mejor los costos de pruebas de estrés o lanzamientos graduales. Además, Anthropic mencionó una renovación de la documentación, nuevos cursos educativos y la expansión del "Claude Cookbook", ofreciendo en general recursos de desarrollo más prácticos y listos para usar.

Si planeas integrar la API de Claude en tu flujo de trabajo, se sugiere comenzar con los patrones de la nueva documentación y el Cookbook, y luego ajustar la elección del modelo y la estrategia de `max_tokens` según los datos del panel, para evitar saturar los costos desde el inicio.

InicioTiendaPedidos