Google Chrome ब्राउज़र में Gemini असिस्टेंट के लिए एक नया टूल "Select from screen" लॉन्च कर रहा है। यह सुविधा उपयोगकर्ताओं को मैन्युअल स्क्रीनशॉट या कॉपी-पेस्ट किए बिना, वर्तमान टैब से किसी भी टेक्स्ट या इमेज को सीधे Gemini के प्रश्न बॉक्स में जोड़ने की अनुमति देती है। जब उपयोगकर्ता इस टूल पर क्लिक करता है, तो वर्तमान टैब हाइलाइट हो जाता है, जिसके बाद वह Gemini द्वारा विश्लेषण के लिए वांछित सामग्री का चयन कर सकता है। यह सुविधा Chrome 149 वर्जन अपडेट के हिस्से के रूप में धीरे-धीरे रोल आउट की जा रही है; यदि उपयोगकर्ताओं को यह विकल्प दिखाई नहीं देता है, तो ब्राउज़र को पुनरारंभ करने पर यह सक्रिय हो जाता है।
इसके साथ ही, Google ने घोषणा की है कि Gemini 3.5 Flash मॉडल में अब कंप्यूटर उपयोग की क्षमता बिल्ट-इन है। डेवलपर्स Gemini API के माध्यम से इस क्षमता को कॉल कर सकते हैं, जिससे मॉडल सीधे स्क्रीन इंटरफ़ेस को नियंत्रित करके विश्लेषण कर सकता है। एक डेमो में दिखाया गया कि 3.5 Flash स्वचालित रूप से Gemini ऐप खोल सकता है, उसके फीचर इंटरफ़ेस को स्कैन कर सकता है, और एक श्रेणीबद्ध कार्य सूची वापस कर सकता है। यह सफलता दर्शाती है कि AI असिस्टेंट अब सिर्फ टेक्स्ट या इमेज को समझने तक सीमित नहीं है, बल्कि इंसानों की तरह सॉफ़्टवेयर को "ऑपरेट" भी कर सकता है – जो ऑटोमेटेड टेस्टिंग, इंटेलीजेंट एजेंट्स और RPA सीनारियोज़ के लिए नई संभावनाएँ खोलता है। यह मॉडल आज से Gemini API में उपयोग के लिए उपलब्ध है।

