Claude 3.5 주요 업데이트: 컴퓨터 조작 및 코딩 능력 대폭 향상

Anthropic이 최근 Claude 3.5 Sonnet 모델을 전면 업그레이드하며 컴퓨터 조작 기능을 추가하고 코딩 성능에서도 새로운 돌파구를 마련했습니다. 이번 업데이트에는 새롭게 출시된 Claude 3.5 Haiku 모델도 포함되어 제품 라인업을 더욱 다양화했습니다. 본 기사에서는 이러한 주목할 만한 새로운 기능들을 자세히 소개합니다.

Claude 3.5 Sonnet, 컴퓨터 조작 기능 추가

새로운 Claude 3.5 Sonnet의 가장 눈에 띄는 업데이트는 컴퓨터를 직접 조작할 수 있는 기능입니다. Anthropic은 이를 위해 전용 API를 구축했으며, 이 API를 통해 모델이 컴퓨터 화면을 인식하고 사람처럼 상호작용할 수 있게 되었습니다. 개발자는 이 API를 통합하여 Claude가 커서 이동, 버튼 클릭, 양식 작성 등의 작업을 수행하도록 할 수 있습니다.

OSWorld 벤치마크 테스트에서 Claude 3.5 Sonnet은 화면 캡처만으로 14.9%의 점수를 기록하며 다른 AI 시스템보다 월등히 높은 성과를 보였습니다. 현재 스크롤이나 드래그와 같은 동작에서는 일부 한계가 있지만, Asana 및 Replit과 같은 주요 기업들이 이미 이 기능을 테스트하고 있습니다. 이 기능은 반복적인 작업 흐름을 자동화할 수 있는 새로운 가능성을 제시합니다.

코딩 성능 대폭 향상 및 최적화

새로운 Claude 3.5 Sonnet은 코딩 성능에서 비약적인 발전을 이루었습니다. SWE-bench Verified 테스트에서 이전 모델의 33.4%에서 49.0%로 점수가 상승했으며, o1-preview을 포함한 여러 추론 모델을 능가했습니다. 초기 고객 피드백에 따르면 GitLab은 이 모델을 DevSecOps 작업에 사용할 때 지연 시간 증가 없이 추론 능력이 10% 향상되었습니다.

또한 Claude 3.5 Haiku는 가장 빠른 차세대 모델로서 코딩 작업에서도 뛰어난 성능을 보여줍니다. SWE-bench Verified에서 40.6%의 점수를 기록하며 많은 공개 모델을 앞질렀고, 이전 세대 Haiku와 동일한 비용과 속도를 유지했습니다. 이러한 개선 덕분에 Claude는 복잡한 소프트웨어 엔지니어링 작업을 처리할 때 더욱 신뢰할 수 있게 되었습니다.

기타 성능 향상 및 모델 선택 가이드

위의 핵심 업데이트 외에도 새로운 Claude 3.5 Sonnet은 여러 벤치마크에서 개선을 보였습니다. TAU-bench 평가에서 소매 분야 점수가 6.6% 포인트 상승하여 69.2%를 기록했습니다. Claude 3.5 Haiku는 낮은 비용과 빠른 속도라는 장점을 그대로 유지하여 사용자 대상 제품이나 빠른 응답이 필요한 환경에 이상적입니다.

현재 Claude 3.5 Sonnet은 모든 사용자에게 공개되어 있으며, 개발자는 Anthropic API 또는 Amazon Bedrock 등의 플랫폼을 통해 접근할 수 있습니다. 이번 업그레이드는 Claude가 프로그래밍 분야에서의 선두 위치를 더욱 강화했을 뿐만 아니라, AI 모델이 디지털 세계를 실제로 이해하고 조작하는 중요한 한 걸음을 의미합니다.

Claude 3.5 Sonnet, 컴퓨터 조작 기능 추가

코딩 성능 대폭 향상 및 최적화

기타 성능 향상 및 모델 선택 가이드

기사 검색

인기 기사

ChatGPT를 가장 잘 활용할 수 있는 몇 가지 프롬프트(Prompt) — 효율을 진짜 10배 올리는 사용법

Claude Code 설치가 계속 오류 나나요? 3단계로 설정 문제를 끝내는 단계별 가이드

ChatGPT Claude Gemini Midjourney 출력이 망했을 때의 트러블슈팅 체크리스트와 프롬프트 KISS 팁

ChatGPT, Claude, Gemini와 Midjourney를 효율적으로 연동하는 워크플로: 출력 불일치와 개고 고충 해결

Spotify 오류 코드 총정리 및 해결 가이드