Introducción a la función “uso de ordenador” de Claude 3.5: ve la pantalla, hace clic y también escribe

La actualización de Claude 3.5 más llamativa es que lleva el producto de “saber conversar” a “saber operar”. En la beta pública, Claude 3.5 puede ver el contenido de la pantalla, mover el cursor, hacer clic en botones y escribir en campos de texto para completar tareas paso a paso. A continuación, explicamos con enfoque editorial qué hay de nuevo en Claude 3.5 para que puedas decidir si merece la pena probarlo de inmediato.

Claude 3.5 añade el “uso de ordenador”: qué puede hacer

El llamado “uso de ordenador” consiste en que tú le das un objetivo a Claude 3.5 y este lo ejecuta siguiendo el flujo de la interfaz como lo haría una persona: primero mira la pantalla y luego decide dónde hacer clic y qué escribir. Es útil para trabajos con muchos pasos operativos, como completar campos uno a uno en un panel web o reorganizar información de una página A a un formulario B. La propia compañía deja claro que sigue siendo una capacidad experimental: a veces Claude 3.5 puede “resbalar” y hacer clic donde no debe o saltarse algún paso, por lo que necesitas supervisar y corregir cuando haga falta.

Formato de lanzamiento: disponible vía API y con soporte multiplataforma

Por ahora, el “uso de ordenador” de Claude 3.5 se ofrece como beta pública a través de API, y los desarrolladores pueden construir directamente sobre la Anthropic API. Además, Claude 3.5 también está disponible en Amazon Bedrock y en Vertex AI de Google Cloud, lo que facilita a las empresas integrarlo según su arquitectura cloud existente. Para los equipos, esto significa que Claude 3.5 no es solo una demo: es una capacidad que puede entrar en sistemas de proceso para automatización.

Actualizaciones del modelo: mejora de Sonnet y refuerzo con Haiku

En esta ocasión se presenta una versión mejorada de Claude 3.5 Sonnet (en el entorno de AWS también puede aparecer con el nombre Sonnet V2), con foco en reforzar el rendimiento en programación y uso de herramientas, manteniendo costes y velocidad similares. La otra línea es Claude 3.5 Haiku, orientada a respuestas más rápidas y menor latencia, adecuada para productos de cara al usuario y para sub-tareas separadas. Para elegir: si necesitas una ejecución compleja y más estable, prioriza Claude 3.5 Sonnet; si lo principal es la velocidad y el rendimiento en volumen, entonces considera Claude 3.5 Haiku.

Seguridad y recomendaciones de uso: empieza por escenarios controlables

Anthropic indica que la nueva versión de Claude 3.5 pasó evaluaciones de seguridad estrictas antes del despliegue y que se probó en colaboración con instituciones de investigación en seguridad de IA de Estados Unidos y Reino Unido; sigue aplicando su estándar ASL-2. En la práctica, se recomienda empezar usando Claude 3.5 en tareas “reversibles”, como navegación de solo lectura, entrada de borradores o sugerencias de pasos, en lugar de ejecutar directamente acciones de alto riesgo como pagos, eliminaciones críticas o cambios de permisos. Si colocas puntos de validación antes de los pasos clave, el “uso de ordenador” de Claude 3.5 puede ahorrar tiempo sin perder control.

Claude 3.5 añade el “uso de ordenador”: qué puede hacer

Formato de lanzamiento: disponible vía API y con soporte multiplataforma

Actualizaciones del modelo: mejora de Sonnet y refuerzo con Haiku

Seguridad y recomendaciones de uso: empieza por escenarios controlables

Buscar artículos

Artículos Populares

Los mejores prompts para ChatGPT: usos que de verdad pueden multiplicar por 10 la eficiencia

La instalación de Claude Code siempre da error: guía paso a paso para resolver el problema de configuración en tres pasos

Lista de verificación para depurar “salidas fallidas” de ChatGPT, Claude, Gemini y Midjourney, y trucos KISS para prompts

Flujo de Trabajo Eficiente: Integra ChatGPT, Claude, Gemini y Midjourney para Coherencia y Menos Estrés en Revisiones

3 Técnicas para Hacer Preguntas Efectivas a ChatGPT y Claude y Obtener Respuestas Precisas