최근 Claude API를 사용하여 애플리케이션이나 AI 에이전트를 개발 중이라면, 가장 직접적으로 눈에 띄는 변화는 콘솔과 문서에서 찾아볼 수 있습니다. Claude API에 사용량 및 비용 대시보드가 새롭게 추가되었고, 릴리즈 노트가 체계적으로 정리되었으며, Claude Sonnet 3.5 모델이 더 긴 출력을 지원하기 시작했습니다. 개발자들이 가장 관심 있어 하는 '확인, 장문 작성, 추적'이라는 세 가지 관점에서 새로운 기능을 자세히 설명하겠습니다.
Claude API 출력 한도 2배 증가: 장문과 코드 전달이 더욱 수월해져
Claude API에서 Claude Sonnet 3.5 모델의 최대 출력 토큰(token) 수가 4,096에서 8,192으로 증가했습니다. 이는 더 긴 요약, 리포트, 코드 생성 및 다단계 추론 결과를 한 번에 반환받는 데 적합합니다. Claude API에서 확장 출력 기능을 사용하려면 요청에 특정 베타 요청 헤더를 추가해야 합니다: "anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15".
실제 사용 시, Claude API에서 '긴 출력' 기능은 정말 필요한 경우에 사용하는 것을 권장합니다. 예를 들어 완성된 PRD(제품 요구사항 문서) 생성, 실행 가능한 스크립트 출력, 또는 주석이 포함된 리팩토링 솔루션을 한 번에 전달해야 할 때 유용합니다. 결론만 필요한 요청의 경우, 여전히 Claude API에서 `max_tokens` 매개변수를 제어하여 예산을 불필요하게 장문의 응답에 소모하는 것을 피하는 것이 좋습니다.
Claude API 콘솔 신규 사용량 및 비용 대시보드: 더 투명해진 청구 내역
개발자 콘솔에 '사용량(Usage)'과 '비용(Spend)' 탭이 추가되면서, Claude API의 소모량을 달러 금액, 토큰 수 및 API 키 별로 확인할 수 있게 되었습니다. 다중 환경이나 다중 프로젝트에서 Claude API 키를 공유하는 팀의 경우, 이를 통해 비정상적인 호출이나 갑작스러운 비용 급증의 원인을 더 빠르게 파악할 수 있습니다.
더 실용적인 점은, Claude API의 실험적 호출과 프로덕션 호출을 분리하여 통계를 낼 수 있다는 것입니다. 다른 서비스에 대해 별도의 API 키를 생성한 후, 대시보드에서 토큰 사용 곡선과 비용 곡선을 비교해보세요. 이렇게 하면 Claude API 예산 논의가 '느낌'에 의존하지 않고, 직접 데이터를 통해 이루어질 수 있습니다.


