Chrome में Gemini का नया 'Select from screen' टूल, 3.5 Flash को मिली कंप्यूटर ऑपरेट करने की क्षमता

Google Chrome ब्राउज़र में Gemini असिस्टेंट के लिए एक नया टूल "Select from screen" लॉन्च कर रहा है। यह सुविधा उपयोगकर्ताओं को मैन्युअल स्क्रीनशॉट या कॉपी-पेस्ट किए बिना, वर्तमान टैब से किसी भी टेक्स्ट या इमेज को सीधे Gemini के प्रश्न बॉक्स में जोड़ने की अनुमति देती है। जब उपयोगकर्ता इस टूल पर क्लिक करता है, तो वर्तमान टैब हाइलाइट हो जाता है, जिसके बाद वह Gemini द्वारा विश्लेषण के लिए वांछित सामग्री का चयन कर सकता है। यह सुविधा Chrome 149 वर्जन अपडेट के हिस्से के रूप में धीरे-धीरे रोल आउट की जा रही है; यदि उपयोगकर्ताओं को यह विकल्प दिखाई नहीं देता है, तो ब्राउज़र को पुनरारंभ करने पर यह सक्रिय हो जाता है।

इसके साथ ही, Google ने घोषणा की है कि Gemini 3.5 Flash मॉडल में अब कंप्यूटर उपयोग की क्षमता बिल्ट-इन है। डेवलपर्स Gemini API के माध्यम से इस क्षमता को कॉल कर सकते हैं, जिससे मॉडल सीधे स्क्रीन इंटरफ़ेस को नियंत्रित करके विश्लेषण कर सकता है। एक डेमो में दिखाया गया कि 3.5 Flash स्वचालित रूप से Gemini ऐप खोल सकता है, उसके फीचर इंटरफ़ेस को स्कैन कर सकता है, और एक श्रेणीबद्ध कार्य सूची वापस कर सकता है। यह सफलता दर्शाती है कि AI असिस्टेंट अब सिर्फ टेक्स्ट या इमेज को समझने तक सीमित नहीं है, बल्कि इंसानों की तरह सॉफ़्टवेयर को "ऑपरेट" भी कर सकता है – जो ऑटोमेटेड टेस्टिंग, इंटेलीजेंट एजेंट्स और RPA सीनारियोज़ के लिए नई संभावनाएँ खोलता है। यह मॉडल आज से Gemini API में उपयोग के लिए उपलब्ध है।

"Select from screen" के साथ इंटरैक्शन की लागत कम होने और 3.5 Flash को कंप्यूटर नियंत्रण क्षमता मिलने से, Google Gemini को एक सामान्य क्वेश्चन-आंसर असिस्टेंट से अधिक सक्रिय डेस्कटॉप एजेंट में अपग्रेड कर रहा है। भविष्य में, उपयोगकर्ता सीधे Gemini को अपनी ओर से क्रॉस-एप्लिकेशन जटिल कार्य करने के लिए कह सकते हैं, जैसे फ़ाइलों को व्यवस्थित करना, फ़ॉर्म भरना या रिपोर्ट का विश्लेषण करना। यह दिशा अन्य कंपनियों द्वारा आगे बढ़ाए जा रहे "AI एजेंट" कॉन्सेप्ट से भी मेल खाती है, और इसके वास्तविक प्रभाव पर करीबी नज़र रखना महत्वपूर्ण होगा।

लेख खोजें

लोकप्रिय लेख

ChatGPT के सबसे उपयोगी कुछ प्रॉम्प्ट (Prompt): ऐसे तरीके जो सच में दक्षता 10 गुना बढ़ा दें

Claude Code की इंस्टॉलेशन हमेशा त्रुटि देती है: तीन चरणों में कॉन्फ़िगरेशन की समस्या हाथों-हाथ हल करें

ChatGPT Claude Gemini Midjourney के आउटपुट के “फेल” होने पर ट्रबलशूटिंग चेकलिस्ट और प्रॉम्प्ट के KISS टिप्स

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

Spotify प्लेबैक त्रुटि कोड: समस्या निवारण गाइड