Claude 3.5今回のアップデートで最も注目したいのは、「会話できる」から「操作できる」へ進化した点です。公開ベータ版では、Claude 3.5が画面の内容を確認し、カーソルを動かしてボタンをクリックし、入力欄に文字を打ち込むことで、手順型のタスクを進められます。以下では編集者の視点でClaude 3.5の新しい変化を整理し、すぐ試す価値があるか判断しやすいように解説します。
Claude 3.5に追加された「コンピューター使用」で何ができる?
いわゆる「コンピューター使用」とは、Claude 3.5に目標を与えると、人が操作するように画面の流れに沿って実行する機能です。まず画面を見て、次にどこをクリックし、何を入力するかを判断します。Web管理画面で項目を順に入力する、Aページの情報を整理してBのフォームへ転記するといった、操作手順が多い作業に向いています。なお公式にも、この機能はまだ実験的な能力だと明記されており、Claude 3.5が誤って別の場所をクリックしたり、手順を抜かしたりすることがあるため、随時ユーザー側で修正・介入する必要があります。
提供形態:APIで利用可能、マルチプラットフォーム対応
現在、Claude 3.5のコンピューター使用は、APIの公開ベータとして提供されており、開発者はAnthropic API上で直接構築できます。あわせて、Claude 3.5はAmazon BedrockおよびGoogle CloudのVertex AIでも利用可能で、企業が既存のクラウド構成に合わせて導入しやすいのが特徴です。チームにとっては、Claude 3.5が単なるデモ用途にとどまらず、業務フローのシステムに組み込み自動化へつなげられるタイプの能力であることを意味します。

