Titikey
होमउपयोगी टिप्सClaudeClaude की नई सुविधा: AI असिस्टेंट अब कंप्यूटर पर माउस और कीबोर्ड कंट्रोल कर सकता है

Claude की नई सुविधा: AI असिस्टेंट अब कंप्यूटर पर माउस और कीबोर्ड कंट्रोल कर सकता है

18/6/2026
Claude

Anthropic ने हाल ही में Claude 3.5 Sonnet में एक क्रांतिकारी अपडेट जोड़ा है – यह अब सिर्फ टाइप करके चैट नहीं करता, बल्कि इंसानों की तरह स्क्रीन देख सकता है, माउस घुमा सकता है और कीबोर्ड पर टाइप कर सकता है, और वास्तव में आपके कंप्यूटर को संभाल सकता है। यदि आप अभी भी मैन्युअल रूप से फॉर्म भर रहे हैं या डेटा कॉपी-पेस्ट कर रहे हैं, तो यह अपग्रेड आपके काम करने के तरीके को पूरी तरह बदल सकता है। आइए देखते हैं कि यह नई "कंप्यूटर ऑपरेशन" क्षमता कितनी शक्तिशाली है और यह किन परिदृश्यों में काम आ सकती है।

Claude कैसे इंसानों की तरह कंप्यूटर को नियंत्रित करता है?

Anthropic ने विशेष रूप से Claude के लिए एक API बनाई है जो इसे कंप्यूटर इंटरफ़ेस को "समझने" में सक्षम बनाती है – सीधे शब्दों में कहें तो यह स्क्रीनशॉट देखता है, बटन और इनपुट बॉक्स की स्थिति को समझता है, और फिर सीधे माउस मूवमेंट, क्लिक और टाइपिंग जैसे कमांड जनरेट करता है। डेवलपर्स इस API को जोड़ने के बाद Claude से इस तरह के कार्य करवा सकते हैं: "मेरे डेस्कटॉप पर Excel शीट खोलो, कॉलम B के नंबर वेब फॉर्म में कॉपी करो और फिर सबमिट करो।" Claude चरण दर चरण स्क्रीन की जाँच करता है, कर्सर घुमाता है, ब्राउज़र को ऑपरेट करता है – पूरी प्रक्रिया ऐसी लगती है जैसे आप दूर से किसी इंटर्न को काम पर लगा रहे हों।

AI की कंप्यूटर उपयोग क्षमता का मूल्यांकन करने वाले OSWorld बेंचमार्क में, नए Claude 3.5 Sonnet ने सिर्फ स्क्रीनशॉट के आधार पर 14.9% स्कोर हासिल किया, जो दूसरे स्थान पर रहे Cradle BAAI (7.8%) से काफी बेहतर है। यदि इसे और अधिक ऑपरेशन स्टेप दिए जाएँ, तो इसका स्कोर 22% तक पहुँच सकता है। हालाँकि यह मनुष्यों के 70% से अधिक के स्तर से अभी भी पीछे है, लेकिन यह वर्तमान AI में सबसे अच्छा "कंप्यूटर उपयोगकर्ता" बन गया है।

कोडिंग क्षमता में भारी सुधार, कोड लिखना अधिक विश्वसनीय

कंप्यूटर ऑपरेट करने के अलावा, नए Claude 3.5 Sonnet ने प्रोग्रामिंग में भी उल्लेखनीय प्रगति दिखाई है। SWE-bench Verified (वास्तविक सॉफ़्टवेयर समस्याओं को हल करने की AI की क्षमता मापने वाला बेंचमार्क) पर इसका स्कोर पिछले 40.6% से बढ़कर 49% हो गया, जो OpenAI o1-preview सहित सभी सार्वजनिक मॉडलों से आगे है। GitLab के परीक्षणों में पाया गया कि Claude की मल्टी-स्टेप सॉफ़्टवेयर डेवलपमेंट प्रक्रियाओं में रीज़निंग क्षमता में 10% सुधार हुआ है, और विलंबता में कोई वृद्धि नहीं हुई है। दूसरे शब्दों में, इसे एक पूरा वेब एप्लिकेशन मॉड्यूल लिखने या जटिल कोड लॉजिक को डीबग करने के लिए कहना पहले से कहीं अधिक विश्वसनीय है।

यदि आपको गति की अधिक आवश्यकता है, तो Anthropic ने एक नया Claude 3.5 Haiku भी तैयार किया है – यह पिछली पीढ़ी के Haiku के समान कीमत और गति पर उपलब्ध है, लेकिन इसकी बुद्धिमत्ता बड़े भाई Claude 3 Opus से भी अधिक है। विशेष रूप से कोडिंग कार्यों में, Haiku ने SWE-bench Verified पर 40.6% स्कोर हासिल किया, जो मूल Claude 3.5 Sonnet और GPT-4 दोनों से बेहतर है। यह उन परिदृश्यों के लिए उपयुक्त है जहाँ तेज़ पुनरावृत्ति और बार-बार कॉल की आवश्यकता होती है, जैसे ऑटोमेटेड टेस्टिंग, लॉग एनालिसिस या कोड ऑटो-कम्प्लीशन।

डेवलपर्स इन नई क्षमताओं का उपयोग कैसे कर सकते हैं?

अपग्रेड किया गया Claude 3.5 Sonnet अब सभी उपयोगकर्ताओं के लिए उपलब्ध है। डेवलपर्स Anthropic API, Amazon Bedrock और Google Cloud के Vertex AI के माध्यम से कंप्यूटर ऑपरेशन फीचर (बीटा संस्करण) तक पहुँच सकते हैं। हालाँकि यह सुविधा अभी पूरी तरह से परिपूर्ण नहीं है – स्क्रॉल करना, ड्रैग-एंड-ड्रॉप, ज़ूम करना जैसी चीज़ें जो इंसानों के लिए बहुत आसान हैं, Claude अक्सर उनमें गलतियाँ करता है, और कभी-कभी लंबे समय तक स्क्रीन रिकॉर्डिंग के कारण कार्य बीच में ही रुक जाता है। लेकिन Asana, Canva, Replit जैसी कंपनियाँ पहले से ही इसका उपयोग दोहराए जाने वाले कार्यों को स्वचालित करने के लिए कर रही हैं, जैसे फॉर्म ऑटो-फिल करना या एप्लिकेशन इंटरफ़ेस की जाँच करना। Claude 3.5 Haiku महीने के अंत में आने की उम्मीद है, जो शुरुआत में केवल टेक्स्ट सपोर्ट करेगा और बाद में इमेज इनपुट जोड़ा जाएगा।

यदि आप एक डेवलपर हैं या अक्सर फॉर्म भरने और डेटा कॉपी करने जैसे छोटे-मोटे कामों से परेशान रहते हैं, तो एक बार Claude को अपने माउस क्लिक करने देने का प्रयास करें। हालाँकि यह अभी भी एक अनाड़ी नौसिखिए जैसा है, लेकिन इसकी प्रगति की गति पहले ही ध्यान देने योग्य है।

होमशॉपऑर्डर