Google внедряет в помощник Gemini для браузера Chrome новый инструмент «Выбрать с экрана» (Select from screen). Он позволяет быстро добавлять любой текст или изображение с текущей вкладки в диалоговый запрос. Достаточно выделить вкладку, нажать «Выбрать с экрана» и обвести нужную область — Gemini автоматически подставит выбранное в поле ввода. В настоящее время функция постепенно распространяется с версией Chrome 149; если она не появилась сразу после обновления, перезапустите браузер. Это обновление значительно упрощает визуальные запросы — пользователям больше не нужно вручную делать скриншоты или копировать/вставлять данные, чтобы ИИ понял конкретные элементы на текущей странице.
Параллельно Google объявила, что модель Gemini 3.5 Flash теперь оснащена встроенным инструментом для работы с компьютером (computer use). Разработчики могут вызывать эту возможность напрямую через Gemini API, позволяя модели имитировать действия человека в интерфейсе — например, просматривать приложения и выполнять аналитические задачи. В официальном примере 3.5 Flash с помощью этого инструмента «анализирует приложение Gemini и возвращает список функций, отсортированных по категориям». Это означает, что модель больше не ограничена пониманием текста — она способна «видеть» и «взаимодействовать» с графическими интерфейсами, открывая новые возможности для автоматизации тестирования, умных ассистентов и других сценариев. Функция компьютерного использования Gemini 3.5 Flash доступна в Gemini API с сегодняшнего дня.

