GoogleはChromeブラウザのGeminiアシスタントに実用的な新機能——「Select from screen(画面選択)」ツールを導入しています。ユーザーがこのツールをクリックすると、現在のタブがハイライト表示され、「任意のテキストまたは画像を選択してGeminiに質問」というプロンプトが表示されます。選択したコンテンツは画像として自動的に会話入力ボックスに追加され、画面上の情報をすばやくクエリできるようになります。この機能はChrome 149バージョンで順次展開され、まだ表示されない場合はブラウザを再起動すると有効になります。
同時に、GoogleはGemini 3.5 Flashモデルに「コンピュータ使用(computer use)」ツールが組み込まれたことを発表。開発者はGemini APIまたはGemini Enterprise Agent Platformを介して呼び出すことができます。このツールにより、モデルはデスクトップアプリのインターフェースを直接分析し、操作を実行可能に。公式サンプルでは、3.5 Flashがコンピュータ使用機能を活用して「Geminiアプリを分析し、分類された機能リストを返す」というデモが行われています。これはAIモデルが単なるテキスト生成から、能動的に環境と対話する重要な一歩を示しています。

