解бор новых функций Claude API: кэширование промптов, возможности цитирования и переключатель вызова инструментов

На этот раз разберём несколько практичных новых возможностей Claude API: кэширование промптов, цитирование и блоки содержимого результатов поиска, а также более тонкий контроль вызова инструментов. Они не «показные», но заметно влияют на стоимость, задержку и управляемость. Ниже быстро разложим по полочкам с точки зрения «как это использовать».

Кэширование промптов: заранее сохраняем повторяющиеся системные подсказки

Если в вашем сценарии Claude API много повторяющихся системных промптов (например, единые правила для службы поддержки, фиксированный формат извлечения, длинный бизнес-контекст), кэширование промптов отлично подходит. Согласно официальному описанию, повторное использование после кэширования может снизить задержку до ~80% и стоимость до ~90%, что особенно полезно для пакетных задач.

На практике рекомендуется вынести «долгосрочно неизменяемую часть» в кэшируемый сегмент, а «каждый раз меняющийся пользовательский ввод» — отдельно, в последующие сообщения. Так Claude API сможет сохранять единообразие вывода и при этом не будет каждый раз повторно тарифицировать один и тот же длинный промпт.

Возможности цитирования и блоки содержимого результатов поиска: RAG проще сделать правильно

Claude API уже поддерживает цитирование, чтобы привязывать ключевую информацию в ответе к источникам. В задачах вопросов-ответов по базе знаний или в retrieval-augmented generation цитаты помогают избежать неловких ситуаций «выглядит правдоподобно, но доказательств нет», а также позволяют на фронтенде показывать пользователю источники для проверки.

Кроме того, блоки содержимого результатов поиска переведены в статус официальной возможности — так удобнее передавать внешние результаты поиска модели в «структуре, пригодной для цитирования». Вы можете попросить Claude API при суммировании проставлять маркеры цитат, а затем на стороне приложения решить, стоит ли принудительно требовать правило «нет цитат — нет вывода».

Более управляемый вызов инструментов: tool_choice поддерживает none

В интерфейсе Messages Claude API параметр tool_choice теперь поддерживает none — чтобы явно запретить модели вызывать какие-либо инструменты. Этот переключатель очень практичен для управления рисками: когда вы обнаруживаете, что ввод содержит чувствительные инструкции, или когда диалог находится на этапе низкого доверия, можно сначала использовать Claude API только для текстового анализа, не позволяя ему инициировать внешние действия.

Одновременно в документации упомянуто: при наличии блоков tool_use и tool_result вам больше не обязательно передавать tools. Для сценариев «проигрывания истории вызовов инструментов» и аудиторского воспроизведения это будет удобнее.

Инструмент использования компьютера: превращаем “советы” в “исполняемые шаги”

Claude API также предоставляет определённый официально инструмент использования компьютера: вместе с моделью он позволяет превращать «как работать за компьютером» в структурированный вывод шагов. Это похоже на стандартизацию процесса UI-автоматизации: вы можете перехватывать выполнение и проверку каждого шага, снижая риск того, что модель начнёт произвольно кликать.

Рекомендация по внедрению — начинать с низкорисковых процессов: например, запросы только на чтение во внутренних системах, скачивание отчётов, предварительное заполнение форм. Когда вы отладите откат при сбоях, проверку по скриншотам и изоляцию прав, можно постепенно расширять на более сложные процессы.

Кэширование промптов: заранее сохраняем повторяющиеся системные подсказки

Возможности цитирования и блоки содержимого результатов поиска: RAG проще сделать правильно

Более управляемый вызов инструментов: tool_choice поддерживает none

Инструмент использования компьютера: превращаем “советы” в “исполняемые шаги”

Поиск статей

Подписка ChatGPT Pro | Скидка 30% | Пополнение за 1 минуту | Продление доступно

Spotify Premium на 3 месяца | Пополнение за $10 | Для вашего аккаунта | Без рекламы и офлайн-прослушивание

Популярные Статьи

Несколько лучших подсказок (Prompt) для ChatGPT: способы использования, которые реально повышают эффективность в 10 раз

Claude Code при установке постоянно выдаёт ошибки: пошагово решаем проблему с настройкой за три шага

Чек-лист отладки и KISS‑приёмы для промптов, когда ChatGPT / Claude / Gemini / Midjourney дают сбой

Эффективный рабочий процесс связки ChatGPT + Claude + Gemini с Midjourney: решаем проблему разрозненного стиля и «краха» при правках

ChatGPT и Claude всегда отвечают невпопад: три приёма постановки вопросов, чтобы ИИ мгновенно понял ваши потребности