Si estás usando la API de Claude para atención al cliente, RAG o como asistente de código, varias actualizaciones recientes merecen que las sigas de inmediato: salidas más largas, citas más claras, reutilización de prompts más barata y herramientas de consola más útiles. A continuación, desde la perspectiva de “lo que puedes empezar a usar ya”, repasamos las nuevas funciones de la API de Claude.
Salida más larga: Sonnet se amplía a 8192 tokens
La API de Claude ya admite la capacidad de salida extendida de Claude Sonnet 3.5: el máximo de salida por solicitud pasa de 4096 a 8192. Para tareas como el resumen de textos largos, la generación de código o la redacción de informes, el truncado se reducirá de forma notable.
La forma de habilitarlo también es directa: al llamar a la API de Claude, basta con añadir el encabezado de solicitud beta especificado para que el servidor eleve el límite de salida de ese modelo. Antes de ponerlo en producción, se recomienda comparar con el mismo conjunto de entradas la integridad del final y la tasa de alucinaciones antes y después de la ampliación, y luego decidir si activarlo por defecto.
Contexto largo: Sonnet ofrece soporte de prueba de 1M tokens
La API de Claude ofrece soporte de prueba para una ventana de contexto ultralarga en Claude Sonnet 4, y al mismo tiempo ha aumentado los límites de tasa relacionados con el contexto largo. Para tareas como “revisión de código de un repositorio completo”, “comparación de un conjunto completo de contratos/documentos de licitación” o “preguntas y respuestas sobre una base de conocimiento de múltiples capítulos”, el contexto largo reducirá significativamente el coste de ingeniería de segmentar y recombinar.
Hay que tener en cuenta que un contexto largo no equivale a algo más barato: cuando el prompt es demasiado largo, la facturación y el rendimiento (throughput) se vuelven más sensibles. Al implementarlo, puedes estratificar entre “el texto original que debe entrar en el contexto” y “material consultable vía recuperación”, para evitar meterlo todo de una sola vez.
Citas y bloques de contenido de resultados de búsqueda: RAG se parece más a “respuestas verificables”
La API de Claude ya ofrece capacidad de citas para atribuir fuentes en las respuestas; además, los bloques de contenido de resultados de búsqueda ya están disponibles oficialmente, ideales para combinarlos con generación aumentada por recuperación (RAG) y producir “respuestas con fuente”. En escenarios como cumplimiento, asuntos legales o bases de conocimiento de posventa, las citas pueden reducir los costes de disputa: el usuario puede ver de dónde proviene la base de la respuesta.


