Google अपने Chrome ब्राउज़र में Gemini असिस्टेंट के लिए "स्क्रीन से चुनें" (Select from screen) नामक एक नया टूल ला रहा है। यह सुविधा उपयोगकर्ताओं को वर्तमान टैब में किसी भी टेक्स्ट या इमेज को तुरंत अपने संवाद प्रॉम्प्ट में जोड़ने की अनुमति देती है। उपयोगकर्ता को बस वर्तमान टैब को हाइलाइट करना होता है, "स्क्रीन से चुनें" विकल्प चुनना होता है और लक्ष्य सामग्री को बॉक्स में चुनना होता है, जिसके बाद Gemini स्वचालित रूप से चयनित छवि या टेक्स्ट को इनपुट बॉक्स में भर देता है। वर्तमान में, यह सुविधा Chrome 149 संस्करण के साथ धीरे-धीरे रोल आउट हो रही है। यदि तुरंत दिखाई न दे, तो ब्राउज़र को पुनः आरंभ करें। यह अपडेट विज़ुअल क्वेरी प्रक्रिया को काफी सरल बनाता है, जिससे उपयोगकर्ताओं को मैन्युअल रूप से स्क्रीनशॉट लेने या कॉपी-पेस्ट करने की आवश्यकता नहीं होती, और AI वर्तमान ब्राउज़िंग पेज के विशिष्ट तत्वों को समझ सकता है।
इसके साथ ही, Google ने यह भी घोषणा की है कि Gemini 3.5 Flash मॉडल अब कंप्यूटर उपयोग (computer use) टूल के साथ शामिल है। डेवलपर्स सीधे Gemini API में इस क्षमता को कॉल कर सकते हैं, जिससे मॉडल मानव-समान इंटरफ़ेस संचालन का अनुकरण कर सकता है, जैसे कि ऐप इंटरफ़ेस को ब्राउज़ करना और विश्लेषण कार्य करना। आधिकारिक उदाहरण में, 3.5 Flash ने इस टूल का उपयोग करके "Gemini ऐप का विश्लेषण किया और श्रेणी के अनुसार व्यवस्थित फीचर्स की सूची लौटाई"। इसका अर्थ है कि मॉडल अब केवल टेक्स्ट समझने तक सीमित नहीं है, बल्कि मानव की तरह ग्राफिकल इंटरफ़ेस को "देख" और "संचालित" कर सकता है, जो स्वचालित परीक्षण, स्मार्ट असिस्टेंट आदि परिदृश्यों के लिए नई संभावनाएं खोलता है। Gemini 3.5 Flash की कंप्यूटर उपयोग सुविधा आज से Gemini API में उपलब्ध है।

