Если вы используете Claude API для поддержки клиентов, RAG или помощника по коду, несколько недавних обновлений действительно стоит сразу взять в работу: более длинные ответы, более понятные ссылки-цитаты, более дешёвое повторное использование промптов и более удобные инструменты консоли. Ниже — обзор новых возможностей Claude API с точки зрения «что можно быстро начать применять».
Более длинный вывод: Sonnet расширен до 8192 токенов
Claude API уже поддерживает расширенные возможности вывода Claude Sonnet 3.5: максимальный объём ответа за один вызов увеличен с 4096 до 8192. Для задач вроде конспектирования длинных текстов, генерации кода и написания отчётов обрезание на середине будет происходить заметно реже.
Способ включения тоже простой: при вызове Claude API достаточно добавить соответствующий beta-заголовок запроса, чтобы сервер поднял лимит вывода для этой модели. Перед запуском в продакшен рекомендуется на одном и том же наборе входных данных сравнить полноту окончания ответа и уровень галлюцинаций до и после расширения, а затем решить, включать ли это по умолчанию.
Длинный контекст: Sonnet предоставляет тестовую поддержку 1M токенов
Claude API в Claude Sonnet 4 предоставляет тестовую поддержку сверхдлинного контекстного окна и одновременно повышает лимиты скорости, связанные с длинным контекстом. Для задач вроде «ревью всего репозитория кода», «сравнение полного пакета договоров/тендерной документации», «вопросы-ответы по базе знаний через несколько глав» длинный контекст существенно снижает инженерные затраты на разбиение и склейку.
Важно помнить: длинный контекст не значит дешевле. При слишком длинном промпте стоимость и пропускная способность становятся более чувствительными. На практике стоит разделять «оригинальные тексты, которые обязаны быть в контексте» и «материалы, которые можно доставать через поиск», чтобы не пытаться забить всё целиком за один раз.
Цитирование и блоки содержимого результатов поиска: RAG больше похож на «проверяемый ответ»
Claude API уже предоставляет возможность цитирования, чтобы указывать источники в ответе; при этом блоки содержимого результатов поиска теперь также официально доступны — удобно сочетать с retrieval-augmented generation (RAG) для «ответов с указанием источников». Для сценариев комплаенса, юридических задач и баз знаний поддержки цитаты снижают издержки на споры: пользователю видно, на чём основан ответ.


