Claude 3.5의 가장 눈에 띄는 업데이트는 '대화'를 '작업 실행'으로 확장한 것입니다. 화면을 보고, 커서를 움직이고, 버튼을 클릭하며 텍스트를 입력할 수 있어, 개발자들은 Claude 3.5가 단순히 제안을 하는 것을 넘어 인터페이스에서 단계별로 작업을 수행할 수 있게 되었습니다.
Claude 3.5 '컴퓨터 사용'이 정확히 무엇인가요?
Claude 3.5는 공개 베타 버전에서 '컴퓨터 사용(computer use)' 기능을 제공하며, 핵심은 모델이 사람처럼 컴퓨터 인터페이스를 사용할 수 있도록 하는 것입니다. 화면 내용을 기반으로 판단한 후 마우스 이동, 클릭 및 키보드 입력과 같은 작업을 실행합니다.
강조할 점은, Claude 3.5 공식적으로 이를 실험 기능으로 명시하고 있다는 것입니다: 사용 가능하지만, 버벅거림, 잘못된 단계 진행 또는 잘못된 위치 클릭이 발생할 수 있습니다. 먼저 통제된 환경에서 테스트한 후 실제 비즈니스 프로세스에 점진적으로 적용하는 것이 적합합니다.
Claude 3.5로 어떤 '다단계 작업'을 할 수 있나요?
전통적인 자동화는 스크립트와 유사하여 인터페이스 변화에 쉽게 무너질 수 있습니다. Claude 3.5의 가치는 '현재 화면을 이해할 수 있다'는 점에 있어, 페이지를 넘나들고, 다양한 양식을 처리하며 단계가 많은 프로세스에 더 적합합니다. 예를 들어 웹사이트 백엔드에서 요구사항에 따라 항목별로 설정하거나, 도구에서 일련의 설정을 완료하거나, 정보를 형식에 맞춰 시스템에 입력하는 등입니다.
일부 팀은 Claude 3.5가 수십에서 수백 단계가 필요한 UI 네비게이션 작업을 수행하도록 탐구하고 있으며, 이를 통해 프로세스 검증, 운영 경로 실행 또는 반복적인 데이터 입력을 지원할 수 있습니다.


