Руководство по обновлению консольного Workbench Claude: длинные ответы, оценивание и панель затрат

Если вы часто используете Claude для разработки, написания скриптов или генерации длинных текстов, это обновление консольного Workbench заметно уменьшит количество «перепросов». Ключевые изменения сосредоточены вокруг поддержки длинных ответов, помощи с промптами, параллельной оценки и более понятного отслеживания использования и расходов. Ниже — разбор новых функций Claude по реальным сценариям.

Длинные ответы Claude Sonnet 3.5: с 4096 до 8192

В API Claude Sonnet 3.5 удвоил верхний предел максимального числа выходных токенов с 4096 до 8192 — длинный код и длинные отчёты больше не будут так часто обрезаться. Чтобы включить расширенный вывод, нужно добавить в запрос указанный beta-заголовок. Для задач генерации, где важно «получить готовый текст за один раз», это изменение даёт самый прямой эффект.

При вызове добавьте: anthropic-beta: max-tokens-3-5-sonnet-2024-07-15, а затем при необходимости задайте max_tokens. Также рекомендуется чётко прописать требования к структуре (например, разделы, списки, формат ответа), иначе даже при более длинном выводе ответы Claude могут стать более расплывчатыми.

Генератор промптов: превращает описание задачи в пригодный Prompt

В Workbench появился генератор промптов: достаточно описать задачу естественным языком (например, «классифицировать и обрабатывать входящие обращения в поддержку»), и Claude предложит более полный черновик промпта. Его ценность не в том, что он «красиво пишет», а в том, что он добавляет то, что легко упустить: роль, ограничения на вход/выход, граничные условия и т. п.

В повседневной работе над внутренними инструментами или PoC можно сначала попросить Claude выдать исполняемый промпт, а затем подстроить поля и примеры под бизнес-правила. Это быстрее, чем писать промпт с нуля, и проще превратить в командный шаблон.

Режим оценки: параллельное сравнение вывода для нескольких промптов

Если для одной и той же задачи вы хотите сравнить два варианта формулировки, раньше приходилось многократно копировать и вставлять. Теперь режим оценки в Workbench может показывать вывод для двух или более промптов бок о бок и вести запись оценок результатов Claude по 5-балльной шкале.

Ещё более практичный подход: зафиксировать один и тот же набор тестовых входов, прогнать разные версии промптов и затем оценить согласованность, стабильность формата и частоту ошибок. Для задач классификации, извлечения и форматированного вывода, которые «должны выйти в прод», этот этап заметно снижает объём переделок.

Панель использования и расходов: отслеживание затрат по долларам, токенам и Key

В консоли разработчика появились вкладки «Использование» и «Расходы», где можно смотреть потребление и счета по сумме в долларах, количеству токенов и по ключам API. Для сред с несколькими пользователями или проектов с несколькими ключами это удобнее, чем видеть только общий итог: проще понять, «кто сжигает токены».

Рекомендуется разделять ключевые задачи по отдельным ключам API: с одной стороны, так проще атрибутировать потребление, с другой — когда ответы Claude становятся длиннее (например, при включении 8192), быстрее понятно, откуда именно взялось изменение стоимости.

Примечания к релизам и учебные ресурсы: обновления больше не нужно угадывать

В документации появились более полные примечания к релизам, охватывающие изменения в API, консоли Claude и приложении Claude — так проще проверить «что изменилось и когда». Одновременно Anthropic обновила документацию и курсы, включая основы Claude API, использование инструментов Claude, а также расширенный Claude Cookbook (руководства по цитированию, RAG, классификации и др.).

Если вы внедряете Claude в бизнес-процессы, имеет смысл сначала закрепить базовые вызовы и структурированный вывод через курсы, а затем вернуться в Workbench и использовать режим оценки для регрессионного тестирования промптов — так процесс пойдёт гораздо ровнее.

Длинные ответы Claude Sonnet 3.5: с 4096 до 8192

Генератор промптов: превращает описание задачи в пригодный Prompt

Режим оценки: параллельное сравнение вывода для нескольких промптов

Панель использования и расходов: отслеживание затрат по долларам, токенам и Key

Примечания к релизам и учебные ресурсы: обновления больше не нужно угадывать

Поиск статей

Подписка ChatGPT Pro | Скидка 30% | Пополнение за 1 минуту | Продление доступно

Spotify Premium на 3 месяца | Пополнение за $10 | Для вашего аккаунта | Без рекламы и офлайн-прослушивание

Популярные Статьи

Несколько лучших подсказок (Prompt) для ChatGPT: способы использования, которые реально повышают эффективность в 10 раз

Claude Code при установке постоянно выдаёт ошибки: пошагово решаем проблему с настройкой за три шага

Чек-лист отладки и KISS‑приёмы для промптов, когда ChatGPT / Claude / Gemini / Midjourney дают сбой

Эффективный рабочий процесс связки ChatGPT + Claude + Gemini с Midjourney: решаем проблему разрозненного стиля и «краха» при правках

ChatGPT и Claude всегда отвечают невпопад: три приёма постановки вопросов, чтобы ИИ мгновенно понял ваши потребности