Claude가 최근 '대화하기'에서 '행동하기'로 능력을 확장했습니다. 새로 도입된 컴퓨터 사용(Computer Use) 기능을 통해 화면의 인터페이스를 인식하고, 커서를 이동시키며, 버튼을 클릭하고 글자를 입력할 수 있게 되었습니다. 본 글은 Claude의 이 새로운 기능이 무엇을 할 수 있는지, 어떤 상황에 적합한지, 그리고 사용하기 전에 인지해야 할 한계를 더 직관적으로 설명합니다.
Claude 컴퓨터 사용이란: 인간처럼 인터페이스를 조작하는 모델
컴퓨터 사용은 Claude가 개발자에게 공개한 공개 테스트 능력으로, 사용자가 지시를 통해 Claude로 하여금 웹페이지나 소프트웨어 인터페이스를 단계적으로 조작하도록 할 수 있습니다. 그 핵심은 '플러그인'이 아니라, Claude가 '화면을 보며' 현재 상태를 이해한 후 다음에 '어디를 클릭하고, 무엇을 입력할지' 결정하는 데 있습니다. 공식적으로도 이 기능은 아직 실험 단계에 있으며, 가끔 멈춤, 잘못된 클릭 또는 방향 이탈이 발생할 수 있어 사람의 감독이 필요하다고 분명히 강조했습니다.
Claude 3.5 Sonnet 업그레이드 포인트: 강화된 코딩 능력과 안정적인 도구 실행
모델 측면에서 Claude 3.5 Sonnet의 업데이트 버전(일부 클라우드 플랫폼에서는 Claude 3.5 Sonnet V2로 명명됨)은 소프트웨어 공학 및 코딩 성능 강화에 중점을 두었습니다. 코드 작성, 버그 수정, 프로젝트 구조 읽기가 필요한 사용자에게 Claude는 요구사항에 따라 사용 가능한 구현 단계를 더 쉽게 출력할 수 있습니다. 컴퓨터 사용 능력과 결합하면, Claude는 '방안 작성'을 '인터페이스를 따라 프로세스를 완료하기'까지 확장할 수 있지만, 안정성을 확인하기 위해 작은 작업부터 시작하는 것이 좋습니다.


