В последнее время Claude обновляется очень быстро, и особенно заметны изменения в возможностях для разработчиков: от структурированного вывода к более длинному контексту и далее — к блокам поисковых результатов с цитированием. В этой статье ключевые новые функции Claude разбиты на несколько частей и объяснены понятно, чтобы вы могли быстро понять, что стоит подключать сразу, а где потребуется миграция с изменениями в коде.
Структурированный вывод вышел в релиз: более стабильный JSON и согласованность со схемой
Структурированный вывод Claude API официально выпущен; его основная ценность в том, что возвращаемое Claude содержимое становится более «проверяемым». Это подходит для строго ограниченных сценариев вроде извлечения данных в формы, разбора заказов, классификации тикетов. По сравнению с тем, чтобы с помощью одних лишь промптов заставлять Claude «выводить JSON», структурированный вывод лучше обеспечивает согласованность со схемой и снижает число сбоев парсинга в продакшене.
Одновременно путь интеграции Claude стал проще: больше не нужно полагаться на beta-заголовки, и появилась более широкая поддержка схем, а также лучшая задержка компиляции синтаксиса. Важно учитывать, что у связанных параметров есть точки миграции: прежний output_format перенесён в output_config.format, поэтому при подключении Claude рекомендуется заодно проверить конфигурацию.
Расширение длинного контекста: окно в 1M токенов в beta
В сценариях с длинными документами, репозиториями кода и агентами с многоходовым диалогом Claude также начал делать акцент на способности «вмещать больше информации». Контекстное окно Claude на 1M токенов уже доступно в beta для некоторых моделей; для запросов с вводом свыше 200K будет применяться тариф длинного контекста — это критично для оценки затрат.
Если вы используете Claude для Q&A по базе знаний или для понимания кода на уровне репозитория, рекомендуется A/B-тестировать «длинный контекст» отдельно от «поиска/ретривала»: то, что можно напрямую поместить в Claude, лучше не дробить слишком мелко; а там, где необходимо ссылаться на источники, подключать ретривал — общий результат обычно стабильнее.


