Самое заслуживающее внимания новшество в Claude 3.5 Sonnet на этот раз — модель начинает «понимать экран и уметь двигать мышью», превращая инструкции на естественном языке в реальный процесс действий на компьютере. Для тех, кому нужно автоматизировать таблицы, ввод данных на сайтах и整理/упорядочивание материалов, границы практического применения Claude 3.5 Sonnet заметно расширились。
Что на самом деле означает «умение работать за компьютером» в Claude 3.5 Sonnet
В Claude 3.5 Sonnet добавлен ориентированный на разработчиков подход к API для управления компьютером: сначала восприятие интерфейса (например, скриншот/состояние экрана), затем разбиение вашего запроса на исполнимые шаги. Он способен пошагово выполнять цепочки вроде «открыть браузер — перейти на страницу — найти поле ввода — заполнить форму — отправить», так что задача больше не ограничивается текстовыми советами.
Ключ здесь не в том, «умеет ли он выходить в интернет», а в том, «умеет ли он действовать по интерфейсу». Claude 3.5 Sonnet спроектирован так, чтобы в многошаговых процессах постоянно выбирать действия и исправлять ошибки; он подходит для автоматизации повторяющихся, мелких и легко допускающих ошибки операций.
Для каких сценариев подходит лучше: таблицы, админки, тестирование и повторяющиеся процессы
Если ваша работа часто упирается в «копировать-вставить + постоянно переключаться между страницами», Claude 3.5 Sonnet будет особенно ценен: извлекать поля из локальных материалов и заполнять ими онлайн-формы или электронные таблицы; по фиксированному маршруту вносить информацию в бэкенд-системах; многократно прогонять один и тот же процесс для разных клиентов или разных партий данных.
Для команд разработки Claude 3.5 Sonnet также лучше подходит как «исполнитель с инструментами»: например, в тестовой среде пошагово кликать, проверять состояние страниц, фиксировать результаты, а затем записывать найденные аномалии обратно в виде списка.
Программирование и использование инструментов тоже усилены
Помимо управления компьютером, Claude 3.5 Sonnet усилили и в задачах программирования и работы с инструментами; официально отмечено заметное улучшение в оценках HumanEval, SWE-bench Verified и других. Самое очевидное для вас: Claude 3.5 Sonnet охотнее выдаёт исполняемый код в заданных рамках, лучше соблюдает формат интерфейсов и реже «съезжает с курса» в многошаговых требованиях.

