Claude는 최근 주목받는 '컴퓨터 사용'(Computer Use) 기능을 추가했습니다. 이제 모델은 단순히 질문에 답변하는 것을 넘어서, 사람처럼 화면을 시각적으로 인식하고, 커서를 이동하며, 버튼을 클릭하고 텍스트를 입력할 수 있습니다. 다단계 처리가 필요한 작업 흐름에서 Claude는 기존의 "채팅 어시스턴트" 역할에서 발전해, 실제 작업을 실행할 수 있는 AI 에이전트에 한 걸음 더 가까워졌습니다.
Claude 컴퓨터 사용이란 정확히 무엇인가
Claude의 컴퓨터 사용 기능은 본질적으로 개발자가 API를 통해 Claude에게 컴퓨터 인터페이스를 사용하도록 "지시"할 수 있게 하는 것입니다. Claude는 먼저 스크린샷과 같은 화면 내용을 이해한 후, 다음에 어떤 위치를 클릭하고 어떤 텍스트를 입력해야 할지 결정합니다. 이 과정에는 화면 분석, 마우스 포인터 이동, 클릭 동작, 그리고 키보드 입력 등이 포함됩니다.
유의할 점은 이 기능이 현재 공개 테스트 단계에 있으며, 공식적으로도 여전히 "번거로울 수 있고 오류가 발생하기 쉽다"고 경고하고 있다는 것입니다. 따라서 완전히 무인으로 운영하기보다는 통제된 환경에서 단계적으로 도입하고 검증하는 것이 더 적합한 접근법입니다.
어떤 다단계 작업들을 연결해 줄 수 있는가
과거 많은 자동화 시도는 "마지막 1km"에서 막히는 경우가 많았습니다. 필요한 정보는 이미 생성되었지만, 여전히 사람이 직접 웹페이지나 소프트웨어로 이동해 복사, 붙여넣기, 클릭 및 제출을 해야 했던 것이죠. Claude의 컴퓨터 사용 기능은 바로 이러한 단편적인 동작들을 연결해 주어, 수십 단계에서 수백 단계에 이르는 길고 반복적인 프로세스형 작업을 처리하는 데 적합합니다.
일반적인 적용 사례로는 내부 관리 시스템에서의 폼 데이터 입력, 여러 웹페이지에 걸친 정보 수집 및 정리, 정해진 규칙에 따른 필드 일괄 채우기, 데스크톱 애플리케이션 내에서의 반복적 설정 구성 및 점검 등이 있습니다. 사용하는 인터페이스의 페이지 구조나 레이아웃이 비교적 안정적일수록 Claude의 실행 정확도와 가치는 더욱 높아집니다.


