코드 생성, 장문 요약 또는 대량 문서 분석에 Claude를 사용한다면, 최근 Claude API의 몇 가지 업데이트가 워크플로우를 크게 바꿀 것입니다: 핵심 모델이 Claude Sonnet 3.5로 업그레이드되었고, API 출력 한도가 확장되었으며, 콘솔에 더 직관적인 사용량 및 비용 추적 기능이 추가되었습니다. '즉시 활용 가능한 변화'를 중심으로 하나씩 살펴보겠습니다.
Claude Sonnet 3.5: 동일 티어에서 더 강력한 기본 선택지
Claude Sonnet 3.5는 공식적으로 중간 수준의 속도와 비용 범위의 주력 모델로 포지셔닝되었지만, 여러 평가에서 이전 세대의 더 고가 모델을 능가하는 성능을 보입니다. 개발자에게 이는 많은 시나리오에서 효과를 위해 더 비싼 모델을 무리하게 선택할 필요가 없음을 의미합니다. Claude API에서 기본 모델을 Sonnet 3.5로 전환하기만 하면 더 안정적인 코드 품질과 텍스트 추론 능력을 얻을 수 있습니다.
실제 사용감으로는 "빠르고, 정확하며, 비교적 복잡한 지시도 처리해야 하는" 요청에 더 적합합니다. 예를 들어 버그 수정, 단위 테스트 작성, 스택 추적 오류 설명, 여러 자료를 실행 가능한 체크리스트로 정리하기 등에 유용합니다.
Claude API 확장 출력: 최대 출력 토큰 4096에서 8192로 증가
이번 업데이트에서 가장 실용적인 변화 중 하나는 Claude Sonnet 3.5가 Claude API에서 '확장 출력(Extended Output)'을 지원하며, 최대 출력 토큰 한도를 4096에서 8192로 두 배 증가시켰다는 점입니다. 긴 코드 완성, 긴 보고서 생성, 표가 포함된 요약 작업 등에서 '중간에 끊기는' 현상을 더 쉽게 피할 수 있게 되었습니다.
활성화 방법도 직접적입니다: API 호출 시 지정된 beta 요청 헤더(문서에 제시된 anthropic-beta 필드)를 추가하면 됩니다. 동시에 프롬프트에서 "섹션별로 출력하고, 목차를 먼저 작성한 후 본문을 작성하라"고 요구하고, 더 높은 max_tokens 값을 설정하면 긴 콘텐츠 생성이 더욱 안정적으로 이루어질 것입니다.


