Anthropic이 최근 Claude 3.5 Sonnet 모델을 전면 업그레이드하며 컴퓨터 조작 기능을 추가하고 코딩 성능에서도 새로운 돌파구를 마련했습니다. 이번 업데이트에는 새롭게 출시된 Claude 3.5 Haiku 모델도 포함되어 제품 라인업을 더욱 다양화했습니다. 본 기사에서는 이러한 주목할 만한 새로운 기능들을 자세히 소개합니다.
Claude 3.5 Sonnet, 컴퓨터 조작 기능 추가
새로운 Claude 3.5 Sonnet의 가장 눈에 띄는 업데이트는 컴퓨터를 직접 조작할 수 있는 기능입니다. Anthropic은 이를 위해 전용 API를 구축했으며, 이 API를 통해 모델이 컴퓨터 화면을 인식하고 사람처럼 상호작용할 수 있게 되었습니다. 개발자는 이 API를 통합하여 Claude가 커서 이동, 버튼 클릭, 양식 작성 등의 작업을 수행하도록 할 수 있습니다.
OSWorld 벤치마크 테스트에서 Claude 3.5 Sonnet은 화면 캡처만으로 14.9%의 점수를 기록하며 다른 AI 시스템보다 월등히 높은 성과를 보였습니다. 현재 스크롤이나 드래그와 같은 동작에서는 일부 한계가 있지만, Asana 및 Replit과 같은 주요 기업들이 이미 이 기능을 테스트하고 있습니다. 이 기능은 반복적인 작업 흐름을 자동화할 수 있는 새로운 가능성을 제시합니다.
코딩 성능 대폭 향상 및 최적화
새로운 Claude 3.5 Sonnet은 코딩 성능에서 비약적인 발전을 이루었습니다. SWE-bench Verified 테스트에서 이전 모델의 33.4%에서 49.0%로 점수가 상승했으며, o1-preview을 포함한 여러 추론 모델을 능가했습니다. 초기 고객 피드백에 따르면 GitLab은 이 모델을 DevSecOps 작업에 사용할 때 지연 시간 증가 없이 추론 능력이 10% 향상되었습니다.

