Anthropic이 최근 Claude 3.5 Sonnet 모델에 대규모 업데이트를 단행하며, 컴퓨터를 직접 제어하는 자율 작업 실행 기능을 추가했습니다. 이제 Claude는 단순한 대화형 어시스턴트를 넘어, 사람처럼 화면을 '보고' 인터페이스를 조작할 수 있어 업무 자동화와 프로그래밍에 새로운 가능성을 열어줍니다.
Claude 자율 작업 실행 기능이 가져온 변화
이 신기능의 핵심은 Anthropic이 특별히 개발한 API로, Claude가 컴퓨터 화면을 인식하고 상호작용할 수 있도록 해줍니다. 개발자가 명령어를 입력하면 Claude는 이를 구체적인 컴퓨터 작업(예: 브라우저 열기, 양식 작성, 스프레드시트 확인 등)으로 변환합니다.
공식 데이터에 따르면, OSWorld 표준 테스트에서 Claude 3.5 Sonnet은 스크린샷 이해도에서 14.9%의 점수를 기록했습니다. 이는 인간 수준(70~75%)에는 미치지 못하지만 다른 AI 모델을 크게 앞서는 수치입니다. 더 많은 단계를 수행할 경우 점수는 22%까지 상승합니다.
Claude의 컴퓨터 조작 기능으로 업무 효율 높이는 방법
일반 사용자에게 Claude의 PC 제어 능력은 번거로운 수동 작업을 크게 줄여줍니다. 예를 들어 여러 데이터 소스에서 정보를 정리해야 할 때, Claude에게 요구사항을 말하기만 하면 관련 소프트웨어를 자동으로 열고 정보를 찾아 채워넣습니다.

