介绍 новых функций Claude API: длинный контекст, цитирование и обновления консоли

Если вы используете Claude API для поддержки клиентов, RAG или помощника по коду, несколько недавних обновлений действительно стоит сразу взять в работу: более длинные ответы, более понятные ссылки-цитаты, более дешёвое повторное использование промптов и более удобные инструменты консоли. Ниже — обзор новых возможностей Claude API с точки зрения «что можно быстро начать применять».

Более длинный вывод: Sonnet расширен до 8192 токенов

Claude API уже поддерживает расширенные возможности вывода Claude Sonnet 3.5: максимальный объём ответа за один вызов увеличен с 4096 до 8192. Для задач вроде конспектирования длинных текстов, генерации кода и написания отчётов обрезание на середине будет происходить заметно реже.

Способ включения тоже простой: при вызове Claude API достаточно добавить соответствующий beta-заголовок запроса, чтобы сервер поднял лимит вывода для этой модели. Перед запуском в продакшен рекомендуется на одном и том же наборе входных данных сравнить полноту окончания ответа и уровень галлюцинаций до и после расширения, а затем решить, включать ли это по умолчанию.

Длинный контекст: Sonnet предоставляет тестовую поддержку 1M токенов

Claude API в Claude Sonnet 4 предоставляет тестовую поддержку сверхдлинного контекстного окна и одновременно повышает лимиты скорости, связанные с длинным контекстом. Для задач вроде «ревью всего репозитория кода», «сравнение полного пакета договоров/тендерной документации», «вопросы-ответы по базе знаний через несколько глав» длинный контекст существенно снижает инженерные затраты на разбиение и склейку.

Важно помнить: длинный контекст не значит дешевле. При слишком длинном промпте стоимость и пропускная способность становятся более чувствительными. На практике стоит разделять «оригинальные тексты, которые обязаны быть в контексте» и «материалы, которые можно доставать через поиск», чтобы не пытаться забить всё целиком за один раз.

Цитирование и блоки содержимого результатов поиска: RAG больше похож на «проверяемый ответ»

Claude API уже предоставляет возможность цитирования, чтобы указывать источники в ответе; при этом блоки содержимого результатов поиска теперь также официально доступны — удобно сочетать с retrieval-augmented generation (RAG) для «ответов с указанием источников». Для сценариев комплаенса, юридических задач и баз знаний поддержки цитаты снижают издержки на споры: пользователю видно, на чём основан ответ.

На практике рекомендуется зафиксировать «формат отображения цитат» в системном промпте: например, требовать вывод по пунктам и добавлять к каждому пункту соответствующую метку источника, чтобы фронтенд рендерил это стабильно.

Дешевле по стоимости: кэширование промптов и более гибкий контроль вызовов инструментов

Claude API предоставляет кэширование промптов (бета-функция), позволяющее кэшировать и переиспользовать длинные промпты, заметно снижая задержку и стоимость. Типичный подход — поместить в кэш редко меняющиеся системные инструкции, длинные политики и фиксированные примеры, а динамической частью отправлять только текущий вопрос пользователя.

Кроме того, в Messages API параметр tool_choice теперь поддерживает значение none, что позволяет принудительно запретить модели вызывать какие-либо инструменты; а при наличии блоков tool_use/tool_result больше не требуется обязательно передавать tools. Для приложений, которым нужен «безопасный вывод чистым текстом», или для «поэтапного выполнения цепочки инструментов», управляемость Claude API становится выше.

Консоль стала удобнее: оценки в воркспейсе и дашборд использования/стоимости

В рабочем пространстве консоли Claude появились генератор промптов и режим оценки: достаточно описать задачу — система поможет набросать промпт, а также позволит сравнивать несколько версий бок о бок и выбирать по оценкам. Для команд, которым нужно быстро итеративно улучшать скрипты, правила классификации и форматы извлечения данных, это гораздо эффективнее, чем «вслепую» править всё в коде.

Дашборд использования и расходов в консоли для разработчиков также стал более полным: поддерживается отслеживание затрат по сумме в долларах, количеству токенов и API-ключам. Рекомендуется настроить бюджетные алерты для Claude API вместе со стратегией квот на уровне ключей, чтобы одна ошибочная серия вызовов не раздула счёт.

Более длинный вывод: Sonnet расширен до 8192 токенов

Длинный контекст: Sonnet предоставляет тестовую поддержку 1M токенов

Цитирование и блоки содержимого результатов поиска: RAG больше похож на «проверяемый ответ»

Дешевле по стоимости: кэширование промптов и более гибкий контроль вызовов инструментов

Консоль стала удобнее: оценки в воркспейсе и дашборд использования/стоимости

Поиск статей

Подписка ChatGPT Pro | Скидка 30% | Пополнение за 1 минуту | Продление доступно

Spotify Premium на 3 месяца | Пополнение за $10 | Для вашего аккаунта | Без рекламы и офлайн-прослушивание

Популярные Статьи

Несколько лучших подсказок (Prompt) для ChatGPT: способы использования, которые реально повышают эффективность в 10 раз

Claude Code при установке постоянно выдаёт ошибки: пошагово решаем проблему с настройкой за три шага

Чек-лист отладки и KISS‑приёмы для промптов, когда ChatGPT / Claude / Gemini / Midjourney дают сбой

Эффективный рабочий процесс связки ChatGPT + Claude + Gemini с Midjourney: решаем проблему разрозненного стиля и «краха» при правках

ChatGPT и Claude всегда отвечают невпопад: три приёма постановки вопросов, чтобы ИИ мгновенно понял ваши потребности