이번 Claude 3.5 Sonnet에서 가장 주목할 만한 새로운 변화는, 모델이 “화면을 이해하고 마우스를 움직일 수” 있도록 하기 시작했다는 점이다. 자연어 지시를 실제 컴퓨터 조작 절차로 바꿔준다. 스프레드시트 자동화, 웹 입력, 자료 정리가 필요한 사람들에게는 Claude 3.5 Sonnet의 활용 범위가 눈에 띄게 넓어졌다.
Claude 3.5 Sonnet의 “컴퓨터 조작 능력”이란 정확히 무엇인가
Claude 3.5 Sonnet에는 개발자를 대상으로 한 컴퓨터 조작 관련 API 접근 방식이 추가됐다. 먼저 컴퓨터 화면(예: 스크린샷/화면 상태)을 인지한 뒤, 당신의 요구를 실행 가능한 단계로 쪼갠다. “브라우저 열기—페이지로 이동—입력칸 찾기—폼 작성—제출” 같은 흐름을 단계대로 수행해, 작업이 더 이상 텍스트 조언에만 머물지 않게 한다.
이 능력의 핵심은 “인터넷을 할 줄 아느냐”가 아니라 “화면을 보고 일을 할 줄 아느냐”에 있다. Claude 3.5 Sonnet은 여러 단계의 절차에서 계속 선택하고 오류를 수정하도록 설계되어, 반복적이고 자잘하며 실수하기 쉬운 작업을 자동화에 맡기기에 적합하다.
어떤 상황에 더 적합한가: 스프레드시트, 백오피스, 테스트, 반복 프로세스
업무가 자주 “복사/붙여넣기 + 페이지를 오가며 전환”에서 막힌다면 Claude 3.5 Sonnet의 가치가 더 커진다. 로컬 자료에서 필드를 추출해 온라인 폼이나 스프레드시트에 입력하고, 백오피스 시스템에서 정해진 경로대로 정보를 등록하며, 한 절차를 서로 다른 고객이나 서로 다른 배치 데이터에 대해 반복 실행할 수 있다.
개발팀 관점에서도 Claude 3.5 Sonnet은 “도구를 갖춘 실행자” 역할에 더 적합하다. 예를 들어 테스트 환경에서 단계대로 클릭하고, 페이지 상태를 검증하고, 결과를 기록한 뒤, 이상 지점을 다시 체크리스트로 기록해 넣을 수 있다.
프로그래밍과 도구 사용도 동시에 강화
컴퓨터를 조작하는 것뿐 아니라, Claude 3.5 Sonnet은 프로그래밍 및 도구 사용 과제에서도 강화가 이뤄졌으며, 공식적으로 HumanEval, SWE-bench Verified 등의 평가에서 뚜렷한 향상이 있었다고 언급됐다. 당신이 가장 직관적으로 느낄 영향은: Claude 3.5 Sonnet이 제약 조건을 지키며 실행 가능한 코드를 더 잘 출력하고, 인터페이스 형식을 더 잘 준수하며, 다단계 요구에서 엇나갈 가능성이 더 줄었다는 점이다.
