Claude 3.5 새로운 기능: 컴퓨터 조작 및 코딩 능력 대폭 업그레이드

Anthropic이 최근 Claude 3.5 Sonnet에 대한 대규모 업데이트를 단행했습니다. 단순한 개선이 아니라, AI가 직접 컴퓨터를 조작할 수 있는 능력을 갖추게 된 것입니다. 쉽게 말해, Claude가 이제 화면을 보고, 마우스를 움직이며, 타이핑까지 할 수 있습니다. 동시에 새로운 Claude 3.5 Haiku 모델도 번개처럼 빠른 속도로 등장해 여러 벤치마크 테스트에서 뛰어난 성능을 보여주고 있습니다. 이번 업데이트는 개발자와 일반 사용자 모두에게 새로운 가능성을 열어줍니다.

Claude 3.5 Sonnet 새로운 기능: 사람처럼 컴퓨터 사용

이번 업데이트의 핵심은 Claude 3.5 Sonnet에 추가된 컴퓨터 조작 능력입니다. Anthropic은 Claude가 화면의 픽셀 정보를 인식하고 사람처럼 상호작용할 수 있도록 전용 API를 개발했습니다. 개발자는 이 API를 통합해 "브라우저 열기, 이메일 로그인, 메일 보내기" 같은 다단계 작업을 Claude가 수행하도록 할 수 있습니다. OSWorld 벤치마크 테스트에서 Claude 3.5 Sonnet은 스크린샷만으로 14.9%의 점수를 기록해 2위를 크게 앞질렀습니다.

물론 이 기능은 아직 테스트 단계에 있으며, 스크롤이나 드래그 같은 세밀한 조작에서는 개선이 필요합니다. 예를 들어, 긴 시간 화면 녹화 중에 작업이 중단될 수 있습니다. 하지만 Canva, DoorDash를 포함한 여러 기업이 이미 이 Claude 기능을 테스트하며 반복 작업 자동화에 활용하고 있습니다. Replit도 이를 이용해 앱을 자동으로 확인하는 Agent를 구축하고 있습니다.

코딩 성능 도약: 업계 최고 수준의 프로그래밍 능력

컴퓨터 조작 외에도 Claude 3.5 Sonnet의 코딩 능력이 비약적으로 향상되었습니다. SWE-bench Verified 테스트에서 이전 33.4%에서 49.0%로 점수가 상승했으며, 이는 전용 추론 모델을 포함한 많은 공개 모델을 능가하는 결과입니다. GitLab 테스트에서도 새로운 Claude가 지연 시간 증가 없이 DevSecOps 작업에 더 강력한 추론 능력을 제공한다는 점이 확인되었습니다.

이제 개발자는 복잡한 다단계 소프트웨어 개발 작업을 더 안심하고 Claude에 맡길 수 있습니다. 또 다른 코딩 능력 평가인 HumanEval 테스트에서 Claude 3.5 Sonnet은 93.7%의 점수를 기록해 실제 소프트웨어 문제 처리 능력이 크게 향상되었습니다. AI와 자주 코드를 작성해야 하는 사용자에게 이번 Claude 업데이트는 확실한 효율성 향상을 가져다줍니다.

Claude 3.5 Haiku: 속도와 지능의 최적 균형

Claude 3.5 Sonnet과 함께 새로운 고속 모델 Claude 3.5 Haiku도 공개되었습니다. 가장 큰 장점은 비용과 속도로, 이전 세대 Haiku와 동일한 수준을 유지하면서도 지능이 대폭 향상되어 이전 플래그십 모델인 Claude 3 Opus와도 견줄 만합니다. 코딩 작업에서 Claude 3.5 Haiku는 SWE-bench Verified에서 40.6%의 점수를 기록해 GPT-4를 포함한 많은 모델을 넘어섰습니다.

제품 포지셔닝 측면에서 Claude 3.5 Haiku는 지연 시간에 민감한 실시간 애플리케이션에 매우 적합합니다. 예를 들어 사용자 대면 제품, 하위 에이전트 작업, 또는 대량 데이터에서 개인화된 경험을 생성하는 서비스에 이상적입니다. 응답 속도가 매우 중요하면서도 지능 수준을 크게 포기하고 싶지 않다면, 이 새로운 모델은 가성비 뛰어난 선택이 될 것입니다.

Claude 3.5 Sonnet 새로운 기능: 사람처럼 컴퓨터 사용

코딩 성능 도약: 업계 최고 수준의 프로그래밍 능력

Claude 3.5 Haiku: 속도와 지능의 최적 균형

기사 검색

인기 기사

ChatGPT를 가장 잘 활용할 수 있는 몇 가지 프롬프트(Prompt) — 효율을 진짜 10배 올리는 사용법

Claude Code 설치가 계속 오류 나나요? 3단계로 설정 문제를 끝내는 단계별 가이드

ChatGPT Claude Gemini Midjourney 출력이 망했을 때의 트러블슈팅 체크리스트와 프롬프트 KISS 팁

ChatGPT, Claude, Gemini와 Midjourney를 효율적으로 연동하는 워크플로: 출력 불일치와 개고 고충 해결

Spotify 오류 코드 총정리 및 해결 가이드