Chrome Gemini, 화면 선택 기능 추가… 3.5 Flash, 컴퓨터 제어 탑재

Google이 Chrome 브라우저의 Gemini에 새로운 'Select from screen' 도구를 출시합니다. 사용자는 Gemini 프롬프트 상자 옆 버튼을 클릭해 현재 탭을 강조 표시하고, 화면의 모든 텍스트나 이미지를 자유롭게 선택할 수 있으며, 선택한 내용이 자동으로 대화에 추가됩니다. 이 기능은 Chrome 149 버전과 함께 점진적으로 배포되며, 즉시 표시되지 않으면 브라우저를 다시 시작하면 활성화됩니다. 이로써 화면 정보를 AI 어시스턴트에 입력하는 과정이 크게 간소화되어, 빠른 질문이나 페이지 요소 분석에 적합합니다.

한편, Google은 Gemini 3.5 Flash 모델에 '컴퓨터 제어(computer use)' 도구가 내장되었다고 발표했습니다. 개발자는 Gemini API를 통해 이 기능을 호출하여 모델이 인터페이스를 직접 조작할 수 있습니다. 예를 들어 Gemini 애플리케이션을 자동으로 분석하고 분류된 기능 목록을 반환하는 것이 가능합니다. 이는 AI가 화면 내용을 이해할 뿐만 아니라 사용자 행동을 시뮬레이션하여 복잡한 작업을 수행할 수 있음을 의미합니다. 현재 3.5 Flash의 컴퓨터 제어 기능은 API 사용자에게 공개되었습니다.

두 업데이트는 각각 일반 사용자와 개발자를 대상으로 하며, AI가 사용자의 디지털 환경에 더 자연스럽게 통합되도록 하는 동일한 방향을 가리킵니다. 화면 캡처에서 능동적인 조작까지, Gemini는 질문 응답 어시스턴트에서 진정한 '디지털 에이전트'로 진화하고 있습니다. Chrome 149의 광범위한 배포와 API 기능 개방에 따라, 앞으로 더 많은 자동화 시나리오가 기대됩니다.

기사 검색

인기 기사

ChatGPT를 가장 잘 활용할 수 있는 몇 가지 프롬프트(Prompt) — 효율을 진짜 10배 올리는 사용법

Claude Code 설치가 계속 오류 나나요? 3단계로 설정 문제를 끝내는 단계별 가이드

ChatGPT Claude Gemini Midjourney 출력이 망했을 때의 트러블슈팅 체크리스트와 프롬프트 KISS 팁

ChatGPT, Claude, Gemini와 Midjourney를 효율적으로 연동하는 워크플로: 출력 불일치와 개고 고충 해결

Spotify 오류 코드 총정리 및 해결 가이드