Presentación de las nuevas funciones de la API de Claude: contexto largo, citas y mejoras de la consola

Si estás usando la API de Claude para atención al cliente, RAG o como asistente de código, varias actualizaciones recientes merecen que las sigas de inmediato: salidas más largas, citas más claras, reutilización de prompts más barata y herramientas de consola más útiles. A continuación, desde la perspectiva de “lo que puedes empezar a usar ya”, repasamos las nuevas funciones de la API de Claude.

Salida más larga: Sonnet se amplía a 8192 tokens

La API de Claude ya admite la capacidad de salida extendida de Claude Sonnet 3.5: el máximo de salida por solicitud pasa de 4096 a 8192. Para tareas como el resumen de textos largos, la generación de código o la redacción de informes, el truncado se reducirá de forma notable.

La forma de habilitarlo también es directa: al llamar a la API de Claude, basta con añadir el encabezado de solicitud beta especificado para que el servidor eleve el límite de salida de ese modelo. Antes de ponerlo en producción, se recomienda comparar con el mismo conjunto de entradas la integridad del final y la tasa de alucinaciones antes y después de la ampliación, y luego decidir si activarlo por defecto.

Contexto largo: Sonnet ofrece soporte de prueba de 1M tokens

La API de Claude ofrece soporte de prueba para una ventana de contexto ultralarga en Claude Sonnet 4, y al mismo tiempo ha aumentado los límites de tasa relacionados con el contexto largo. Para tareas como “revisión de código de un repositorio completo”, “comparación de un conjunto completo de contratos/documentos de licitación” o “preguntas y respuestas sobre una base de conocimiento de múltiples capítulos”, el contexto largo reducirá significativamente el coste de ingeniería de segmentar y recombinar.

Hay que tener en cuenta que un contexto largo no equivale a algo más barato: cuando el prompt es demasiado largo, la facturación y el rendimiento (throughput) se vuelven más sensibles. Al implementarlo, puedes estratificar entre “el texto original que debe entrar en el contexto” y “material consultable vía recuperación”, para evitar meterlo todo de una sola vez.

Citas y bloques de contenido de resultados de búsqueda: RAG se parece más a “respuestas verificables”

La API de Claude ya ofrece capacidad de citas para atribuir fuentes en las respuestas; además, los bloques de contenido de resultados de búsqueda ya están disponibles oficialmente, ideales para combinarlos con generación aumentada por recuperación (RAG) y producir “respuestas con fuente”. En escenarios como cumplimiento, asuntos legales o bases de conocimiento de posventa, las citas pueden reducir los costes de disputa: el usuario puede ver de dónde proviene la base de la respuesta.

En la práctica, se recomienda incorporar en el prompt del sistema el “formato de visualización de las citas”, por ejemplo exigiendo que la salida se liste por puntos y que al final de cada punto se adjunte el marcador de la fuente correspondiente, para asegurar una renderización estable en el frontend.

Más ahorro de costes: caché de prompts y control más flexible de llamadas a herramientas

La API de Claude ofrece caché de prompts (función beta), que permite almacenar y reutilizar prompts largos, reduciendo de forma notable la latencia y el coste. Un uso típico es poner en caché instrucciones del sistema que cambian poco, políticas extensas o ejemplos fijos, y enviar como parte dinámica únicamente la pregunta del usuario de esa interacción.

Además, en la Messages API, tool_choice ahora admite none, lo que permite forzar al modelo a no llamar a ninguna herramienta; y, cuando se incluyen bloques tool_use/tool_result, ya no se exige proporcionar necesariamente tools. Para aplicaciones que requieren “salida segura de texto puro” o “ejecución por fases de una cadena de herramientas”, la API de Claude ofrece mayor control.

Una consola más útil: evaluaciones en el Workbench y panel de uso y costes

El Workbench de la consola de Claude incorpora un generador de prompts y un modo de evaluación: solo tienes que describir la tarea y el sistema puede ayudarte a redactar un prompt, además de permitir comparar en paralelo varias versiones y elegir mediante puntuación. Para equipos que necesitan iterar rápidamente guiones, reglas de clasificación o formatos de extracción, esto es mucho más eficiente que hacer cambios a ciegas en el código.

El panel de uso y costes de la consola para desarrolladores también es más completo: permite seguir el gasto por importe en dólares, número de tokens y clave de API. Se recomienda implementar alertas de presupuesto para la API de Claude junto con políticas de cuota a nivel de clave, para evitar que una llamada errónea dispare la factura.

Salida más larga: Sonnet se amplía a 8192 tokens

Contexto largo: Sonnet ofrece soporte de prueba de 1M tokens

Citas y bloques de contenido de resultados de búsqueda: RAG se parece más a “respuestas verificables”

Más ahorro de costes: caché de prompts y control más flexible de llamadas a herramientas

Una consola más útil: evaluaciones en el Workbench y panel de uso y costes

Buscar artículos

Suscripción ChatGPT Pro | 30% de descuento | Recarga en 1 minuto | Renovación disponible

Spotify Premium 3 meses | Recarga de $10 | Para tu propia cuenta | Sin anuncios y reproducción offline

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

Flujo de Trabajo Eficiente: Integra ChatGPT, Claude, Gemini y Midjourney para Coherencia y Menos Estrés en Revisiones

3 Técnicas para Hacer Preguntas Efectivas a ChatGPT y Claude y Obtener Respuestas Precisas