Google ने हाल ही में Chrome ब्राउज़र में Gemini असिस्टेंट के लिए एक व्यावहारिक "Select from screen" टूल लॉन्च किया है। उपयोगकर्ता बस इस टूल पर क्लिक करके वर्तमान टैब को हाइलाइट कर सकते हैं और स्वतंत्र रूप से कोई भी टेक्स्ट या इमेज चुन सकते हैं; चयनित सामग्री स्वचालित रूप से Gemini के प्रॉम्प्ट बॉक्स में जुड़ जाती है। यह सुविधा वर्तमान में Chrome 149 के भाग के रूप में धीरे-धीरे रोल आउट की जा रही है। यदि तुरंत दिखाई न दे, तो ब्राउज़र को पुनः आरंभ करके अनुभव किया जा सकता है। यह स्क्रीन की जानकारी को AI वार्तालाप में लाने की प्रक्रिया को बेहद सरल बनाता है, जिससे प्रश्न पूछना अधिक सहज और कुशल हो जाता है।
इसके साथ ही, Google ने घोषणा की है कि Gemini 3.5 Flash मॉडल में अब कंप्यूटर उपयोग (computer use) क्षमता अंतर्निहित है। डेवलपर्स Gemini API के माध्यम से इस मॉडल को कॉल कर सकते हैं, जिससे यह मनुष्यों की तरह इंटरफ़ेस संचालित कर सकता है और एप्लिकेशन सामग्री का विश्लेषण कर सकता है। उदाहरण के लिए, 3.5 Flash स्वचालित रूप से Gemini एप्लिकेशन खोल सकता है और वर्गीकृत सुविधाओं की सूची लौटा सकता है। यह प्रगति AI एजेंट (AI Agent) क्षमताओं के और अधिक यथार्थ कार्यान्वयन को चिह्नित करती है, जो स्वचालित परीक्षण, स्मार्ट सहायकों जैसे परिदृश्यों के लिए नई संभावनाएँ खोलती है।

