Titikey
유용한 팁클로드**제목:** Claude 자율 작업 실행 신기능: AI가 컴퓨터를 직접 조작하는 완벽 가이드

**제목:** Claude 자율 작업 실행 신기능: AI가 컴퓨터를 직접 조작하는 완벽 가이드

2026. 6. 28.
Claude

Anthropic이 최근 Claude 3.5 Sonnet 모델에 대규모 업데이트를 단행하며, 컴퓨터를 직접 제어하는 자율 작업 실행 기능을 추가했습니다. 이제 Claude는 단순한 대화형 어시스턴트를 넘어, 사람처럼 화면을 '보고' 인터페이스를 조작할 수 있어 업무 자동화와 프로그래밍에 새로운 가능성을 열어줍니다.

Claude 자율 작업 실행 기능이 가져온 변화

이 신기능의 핵심은 Anthropic이 특별히 개발한 API로, Claude가 컴퓨터 화면을 인식하고 상호작용할 수 있도록 해줍니다. 개발자가 명령어를 입력하면 Claude는 이를 구체적인 컴퓨터 작업(예: 브라우저 열기, 양식 작성, 스프레드시트 확인 등)으로 변환합니다.

공식 데이터에 따르면, OSWorld 표준 테스트에서 Claude 3.5 Sonnet은 스크린샷 이해도에서 14.9%의 점수를 기록했습니다. 이는 인간 수준(70~75%)에는 미치지 못하지만 다른 AI 모델을 크게 앞서는 수치입니다. 더 많은 단계를 수행할 경우 점수는 22%까지 상승합니다.

Claude의 컴퓨터 조작 기능으로 업무 효율 높이는 방법

일반 사용자에게 Claude의 PC 제어 능력은 번거로운 수동 작업을 크게 줄여줍니다. 예를 들어 여러 데이터 소스에서 정보를 정리해야 할 때, Claude에게 요구사항을 말하기만 하면 관련 소프트웨어를 자동으로 열고 정보를 찾아 채워넣습니다.

현재 Replit, Canva, DoorDash를 포함한 여러 기업이 이 기능을 테스트하고 있습니다. Replit은 이를 활용해 전용 앱 검사 도구를 개발, 코딩 과정에서 코드 성능을 자동 평가하고 있습니다. 이러한 자율 작업 실행 능력 덕분에 Claude는 반복성이 높고 단계가 많은 워크플로에 특히 적합합니다.

Claude 신기능: 더 강력해진 코딩 및 다단계 작업 처리

컴퓨터 조작 능력 외에도 이번 업데이트는 Claude의 코딩 역량을 대폭 향상시켰습니다. SWE-bench Verified 테스트에서 Claude 3.5 Sonnet의 점수는 33.4%에서 49%로 급등하며 OpenAI o1-preview를 포함한 모든 공개 모델을 능가했습니다.

TAU-bench 소매 분야 테스트에서 Claude의 점수는 62.6%에서 69.2%로 상승했습니다. GitLab과 Cognition 등의 기업 초기 피드백에 따르면, 새 모델은 장기 작업 및 다단계 소프트웨어 개발 프로세스에서 뛰어난 성능을 보여주며 몇 시간 동안 안정적으로 작동합니다. 복잡한 작업을 효율적으로 처리해야 하는 개발자와 사용자에게 이번 Claude 업그레이드는 주목할 만한 가치가 있습니다.

상품주문