최근 Claude API로 요약을 하거나, 코드를 작성하거나, 긴 글을 생성하고 있다면 가장 직관적으로 느껴지는 변화는 “더 길게 출력할 수 있게 됐다”는 점이고, 동시에 개발자 콘솔도 더 쓰기 좋아졌다는 점이다. 이 글에서는 Claude API의 몇 가지 새 기능을 나눠서 명확히 설명한다: 장문 출력을 어떻게 켜는지, 워크벤치로 프롬프트를 어떻게 평가하는지, 그리고 대시보드에서 비용을 어떻게 제대로 파악하는지.
Claude API 장문 출력: Sonnet 3.5가 4096에서 8192로 상향
Claude API는 Claude Sonnet 3.5의 최대 출력 토큰 상한을 8192로 올렸지만, 명시적으로 활성화해야 한다. Claude API를 호출할 때 요청 헤더에 anthropic-beta를 추가하면 더 긴 출력 창을 사용할 수 있으며, 한 번에 더 완성도 높은 보고서, 긴 코드 파일, 또는 여러 단락으로 된 요약을 생성하는 데 적합하다.
구체적인 작성 방식은 매우 명확하다: 요청 헤더에 anthropic-beta: max-tokens-3-5-sonnet-2024-07-15를 추가한다. Claude API에서 “출력이 잘렸다”는 문제를 겪는다면, 먼저 이 스위치를 켜는 것을 잊지 않았는지, 그리고 max_tokens를 충분히 크게 설정했는지부터 확인하자.
워크벤치가 더 편리해짐: 프롬프트 생성기와 평가 모드
Claude 콘솔의 워크벤치에서 Claude API 디버깅 경험을 보완해주는 핵심 도구 두 가지가 추가됐다. 첫 번째는 “프롬프트 생성기”로, 작업 목표(예: “인바운드 고객센터 요청 분류”)만 설명하면 구조가 완성된, Claude API에 바로 복사해 사용할 수 있는 프롬프트 초안을 만들어 준다.
두 번째는 “평가 모드”로, 두 개 또는 여러 개의 프롬프트를 나란히 두고 동일한 입력 묶음에 대해 실행하면 결과를 함께 비교할 수 있고, 5점 척도로 성능을 채점할 수도 있다. 안정적인 산출물이 필요한 Claude API 활용 시나리오(고객 문의 라우팅, 정보 추출, 컴플라이언스 리라이팅)에서는 이 단계가 감으로 파라미터를 조정하는 일을 크게 줄여 준다.


