고객 지원, RAG(검색 증강 생성), 코드 어시스턴트용 Claude API를 사용 중이라면, 최근의 몇 가지 업데이트를 즉시 따라가는 것이 좋습니다: 더 긴 출력, 더 명확한 인용, 비용을 절약해 주는 프롬프트 재사용, 그리고 더 나은 콘솔 도구가 그것입니다. 아래에서는 '지금 바로 사용할 수 있는' 관점에서 Claude API의 신규 기능을 하나씩 살펴보겠습니다.
더 긴 출력: Sonnet, 8192 토큰으로 확장
Claude API는 이제 Claude Sonnet 3.5의 확장 출력 기능을 지원하며, 단일 출력 최대 토큰 수가 4096에서 8192로 증가했습니다. 장문 요약, 코드 생성, 보고서 작성과 같은 작업에서 내용이 중간에 잘리는 현상이 줄어듭니다.
활성화 방법도 간단합니다: Claude API를 호출할 때 지정된 beta 요청 헤더를 추가하기만 하면 서버 측에서 해당 모델의 출력 상한을 완화해 줍니다. 본격 적용 전에는 동일한 입력으로 확장 전후의 끝부분 완성도와 환각(Hallucination) 발생률을 비교한 후, 기본적으로 활성화할지 결정하는 것이 좋습니다.
긴 컨텍스트: Sonnet, 100만 토큰 테스트 지원
Claude API는 Claude Sonnet 4에서 초장기 컨텍스트 창(롱 컨텍스트) 테스트 지원을 제공하며, 관련 속도 제한도 동시에 상향했습니다. '저장소 전체 코드 리뷰', '계약서/입찰 문서 전체 비교', '다수 장에 걸친 지식베이스 질의응답'과 같은 작업에서, 긴 컨텍스트는 구간을 나누어 결합하는 공수(工數)를 현저히 줄여줍니다.
주의할 점은, 긴 컨텍스트가 더 저렴하다는 의미는 아니라는 것입니다. 프롬프트가 너무 길 경우 비용 청구와 처리량(Throughput)에 더 민감해질 수 있습니다. 실제 적용 시에는 '반드시 컨텍스트에 포함시켜야 할 원문'과 '검색 가능한 자료'를 구분하여 계층화하고, 모든 내용을 한 번에 가득 채우는 것을 피해야 합니다.
인용 및 검색 결과 콘텐츠 블록: RAG가 더 '검증 가능한 답변'에 가까워지다
Claude API는 답변에 출처를 표시하는 인용 기능을 제공합니다. 동시에 검색 결과 콘텐츠 블록도 정식으로 사용 가능해져, 검색 증강 생성(RAG)과 결합한 '출처가 명시된 응답' 구성에 적합합니다. 규정 준수, 법무, 애프터서비스 지식베이스와 같은 시나리오에서 인용은 논란의 소지를 줄여줍니다: 사용자는 답변의 근거가 어디서 비롯된 것인지 확인할 수 있습니다.


