La actualización de Claude 3.5 más llamativa es que lleva el producto de “saber conversar” a “saber operar”. En la beta pública, Claude 3.5 puede ver el contenido de la pantalla, mover el cursor, hacer clic en botones y escribir en campos de texto para completar tareas paso a paso. A continuación, explicamos con enfoque editorial qué hay de nuevo en Claude 3.5 para que puedas decidir si merece la pena probarlo de inmediato.
Claude 3.5 añade el “uso de ordenador”: qué puede hacer
El llamado “uso de ordenador” consiste en que tú le das un objetivo a Claude 3.5 y este lo ejecuta siguiendo el flujo de la interfaz como lo haría una persona: primero mira la pantalla y luego decide dónde hacer clic y qué escribir. Es útil para trabajos con muchos pasos operativos, como completar campos uno a uno en un panel web o reorganizar información de una página A a un formulario B. La propia compañía deja claro que sigue siendo una capacidad experimental: a veces Claude 3.5 puede “resbalar” y hacer clic donde no debe o saltarse algún paso, por lo que necesitas supervisar y corregir cuando haga falta.
Formato de lanzamiento: disponible vía API y con soporte multiplataforma
Por ahora, el “uso de ordenador” de Claude 3.5 se ofrece como beta pública a través de API, y los desarrolladores pueden construir directamente sobre la Anthropic API. Además, Claude 3.5 también está disponible en Amazon Bedrock y en Vertex AI de Google Cloud, lo que facilita a las empresas integrarlo según su arquitectura cloud existente. Para los equipos, esto significa que Claude 3.5 no es solo una demo: es una capacidad que puede entrar en sistemas de proceso para automatización.

