Если вы обычно используете Claude для разработки или настройки, то в этой волне обновлений самое важное: Workbench сделал «написание промптов» и «сравнение промптов» встроенными инструментами, а на стороне API также подняли верхний предел длины вывода. В этой статье, в порядке реального использования, подробно объясняется, как пользоваться генератором промптов Claude, режимом оценки, расширенным выводом и недавно запущенными заметками о релизах.
Расширенный вывод Claude Sonnet 3.5: с 4096 до 8192 токенов
В Claude API максимальный лимит выходных токенов для Claude Sonnet 3.5 был увеличен вдвое: с 4096 до 8192. Для задач вроде суммаризации длинных текстов, генерации кода или случаев, где нужно «полностью выдать шаги», Claude с меньшей вероятностью будет обрезан на полпути.
Включается это тоже просто: добавьте в запрос заголовок anthropic-beta со значением max-tokens-3-5-sonnet-2024-07-15. Затем задайте max_tokens как обычно — и Claude будет работать по новой политике верхнего лимита.
Генератор промптов в Workbench: сначала опишите задачу, затем попросите Claude написать промпт
В Workbench в консоли Claude появился генератор промптов; идея такая: «вы формулируете требования, Claude помогает написать переиспользуемый промпт». Например, достаточно описать «классифицировать и обрабатывать входящие запросы в поддержку клиентов», и Claude сгенерирует более цельный шаблон инструкций, обычно также добавив формат вывода и граничные условия.
Эта функция подходит двум категориям людей: во‑первых, командам, которым нужно, чтобы коллеги могли переиспользовать требования; во‑вторых, разработчикам, которые строят автоматизацию, но постоянно ощущают нестабильность промптов. Возьмите версию, сгенерированную Claude, как черновик и затем подстройте под бизнес‑поля — это сэкономит больше времени, чем писать с нуля.
Режим оценки: параллельное сравнение нескольких промптов и выставление оценок выводу Claude
Режим оценки в Workbench позволяет показывать результаты двух или более промптов бок о бок и оценивать ответы Claude по 5‑балльной шкале. Он решает очень практичную боль: для одной и той же задачи изменение одной фразы действительно улучшило результат или нет — раньше это приходилось определять «на ощущениях».


