Если вы недавно используете Claude API для создания приложений или агентных систем, самые заметные изменения пришли из консоли и документации: в Claude API добавили панель мониторинга использования и расходов, дополнили примечания к релизам, а в Claude API Claude Sonnet 3.5 поддерживает более длинный вывод. Ниже — разбор новых возможностей с точки зрения того, что разработчикам важнее всего: «видеть ясно, писать длинно, отслеживать».
Лимит вывода Claude API удвоен: длинные тексты и код стало проще выдавать
В Claude API максимальный вывод токенов для Claude Sonnet 3.5 увеличен с 4096 до 8192 — это подходит для более длинных резюме, отчётов, генерации кода и возврата результатов многошаговых рассуждений за один раз. Чтобы включить расширенный вывод в Claude API, нужно добавить в запрос указанный beta-заголовок: "anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15".
На практике рекомендуется оставлять «длинный вывод» в Claude API для сценариев, где он действительно нужен, например: генерация полноценного PRD, вывод исполняемого скрипта или разовая поставка плана рефакторинга с комментариями. Для запросов, где нужен только итог, в Claude API по-прежнему лучше контролировать max_tokens, чтобы не сжигать бюджет на многословные формулировки.
В консоли Claude API добавлена панель использования и расходов: биллинг стал прозрачнее
После появления в консоли разработчика вкладок «Использование» и «Расходы» потребление Claude API наконец можно смотреть в разрезе суммы в долларах, количества токенов и API-ключей. Для команд, которые используют один и тот же ключ Claude API в нескольких средах и проектах, это позволяет быстрее находить аномальные вызовы и источники внезапного роста затрат.
Ещё более полезно то, что можно раздельно учитывать экспериментальные и продакшен-вызовы Claude API: разделить API-ключи по разным сервисам, а затем в панели сопоставлять кривые токенов и расходов. Так обсуждение бюджета Claude API перестаёт строиться на «ощущениях» — вместо этого можно прямо опираться на данные.


