**Новый инструмент выбора экрана в Chrome Gemini: модель 3.5 Flash получила возможность управления компьютером** - Gemini | Titikey

Google внедряет в помощник Gemini для браузера Chrome новый инструмент «Выбрать с экрана» (Select from screen). Он позволяет быстро добавлять любой текст или изображение с текущей вкладки в диалоговый запрос. Достаточно выделить вкладку, нажать «Выбрать с экрана» и обвести нужную область — Gemini автоматически подставит выбранное в поле ввода. В настоящее время функция постепенно распространяется с версией Chrome 149; если она не появилась сразу после обновления, перезапустите браузер. Это обновление значительно упрощает визуальные запросы — пользователям больше не нужно вручную делать скриншоты или копировать/вставлять данные, чтобы ИИ понял конкретные элементы на текущей странице.

Параллельно Google объявила, что модель Gemini 3.5 Flash теперь оснащена встроенным инструментом для работы с компьютером (computer use). Разработчики могут вызывать эту возможность напрямую через Gemini API, позволяя модели имитировать действия человека в интерфейсе — например, просматривать приложения и выполнять аналитические задачи. В официальном примере 3.5 Flash с помощью этого инструмента «анализирует приложение Gemini и возвращает список функций, отсортированных по категориям». Это означает, что модель больше не ограничена пониманием текста — она способна «видеть» и «взаимодействовать» с графическими интерфейсами, открывая новые возможности для автоматизации тестирования, умных ассистентов и других сценариев. Функция компьютерного использования Gemini 3.5 Flash доступна в Gemini API с сегодняшнего дня.

От «Выбрать с экрана» до «компьютерного использования» — Google превращает ИИ из «собеседника» в «природно-экранный» агент. Первое снижает порог взаимодействия обычных пользователей с AI, второе открывает разработчикам двери для автоматизации сложных графических интерфейсов. С углублённой интеграцией браузера Chrome и модели Gemini в будущем AI сможет просматривать веб-страницы, заполнять формы и даже выполнять многошаговые задачи — возможно, это ещё один ключевой шаг к универсальному цифровому помощнику. Однако вопрос баланса между автоматизацией и конфиденциальностью пользователей остаётся центральной темой, требующей постоянного внимания.

Новый инструмент выбора экрана в Chrome Gemini: модель 3.5 Flash получила возможность управления компьютером

Поиск статей

Популярные Статьи

Несколько лучших подсказок (Prompt) для ChatGPT: способы использования, которые реально повышают эффективность в 10 раз

Claude Code при установке постоянно выдаёт ошибки: пошагово решаем проблему с настройкой за три шага

Чек-лист отладки и KISS‑приёмы для промптов, когда ChatGPT / Claude / Gemini / Midjourney дают сбой

Эффективный рабочий процесс связки ChatGPT + Claude + Gemini с Midjourney: решаем проблему разрозненного стиля и «краха» при правках

Сборник кодов ошибок Spotify и руководство по их устранению