Claude की नई सुविधा: AI असिस्टेंट अब कंप्यूटर पर माउस और कीबोर्ड कंट्रोल कर सकता है

Anthropic ने हाल ही में Claude 3.5 Sonnet में एक क्रांतिकारी अपडेट जोड़ा है – यह अब सिर्फ टाइप करके चैट नहीं करता, बल्कि इंसानों की तरह स्क्रीन देख सकता है, माउस घुमा सकता है और कीबोर्ड पर टाइप कर सकता है, और वास्तव में आपके कंप्यूटर को संभाल सकता है। यदि आप अभी भी मैन्युअल रूप से फॉर्म भर रहे हैं या डेटा कॉपी-पेस्ट कर रहे हैं, तो यह अपग्रेड आपके काम करने के तरीके को पूरी तरह बदल सकता है। आइए देखते हैं कि यह नई "कंप्यूटर ऑपरेशन" क्षमता कितनी शक्तिशाली है और यह किन परिदृश्यों में काम आ सकती है।

Claude कैसे इंसानों की तरह कंप्यूटर को नियंत्रित करता है?

Anthropic ने विशेष रूप से Claude के लिए एक API बनाई है जो इसे कंप्यूटर इंटरफ़ेस को "समझने" में सक्षम बनाती है – सीधे शब्दों में कहें तो यह स्क्रीनशॉट देखता है, बटन और इनपुट बॉक्स की स्थिति को समझता है, और फिर सीधे माउस मूवमेंट, क्लिक और टाइपिंग जैसे कमांड जनरेट करता है। डेवलपर्स इस API को जोड़ने के बाद Claude से इस तरह के कार्य करवा सकते हैं: "मेरे डेस्कटॉप पर Excel शीट खोलो, कॉलम B के नंबर वेब फॉर्म में कॉपी करो और फिर सबमिट करो।" Claude चरण दर चरण स्क्रीन की जाँच करता है, कर्सर घुमाता है, ब्राउज़र को ऑपरेट करता है – पूरी प्रक्रिया ऐसी लगती है जैसे आप दूर से किसी इंटर्न को काम पर लगा रहे हों।

AI की कंप्यूटर उपयोग क्षमता का मूल्यांकन करने वाले OSWorld बेंचमार्क में, नए Claude 3.5 Sonnet ने सिर्फ स्क्रीनशॉट के आधार पर 14.9% स्कोर हासिल किया, जो दूसरे स्थान पर रहे Cradle BAAI (7.8%) से काफी बेहतर है। यदि इसे और अधिक ऑपरेशन स्टेप दिए जाएँ, तो इसका स्कोर 22% तक पहुँच सकता है। हालाँकि यह मनुष्यों के 70% से अधिक के स्तर से अभी भी पीछे है, लेकिन यह वर्तमान AI में सबसे अच्छा "कंप्यूटर उपयोगकर्ता" बन गया है।

कोडिंग क्षमता में भारी सुधार, कोड लिखना अधिक विश्वसनीय

कंप्यूटर ऑपरेट करने के अलावा, नए Claude 3.5 Sonnet ने प्रोग्रामिंग में भी उल्लेखनीय प्रगति दिखाई है। SWE-bench Verified (वास्तविक सॉफ़्टवेयर समस्याओं को हल करने की AI की क्षमता मापने वाला बेंचमार्क) पर इसका स्कोर पिछले 40.6% से बढ़कर 49% हो गया, जो OpenAI o1-preview सहित सभी सार्वजनिक मॉडलों से आगे है। GitLab के परीक्षणों में पाया गया कि Claude की मल्टी-स्टेप सॉफ़्टवेयर डेवलपमेंट प्रक्रियाओं में रीज़निंग क्षमता में 10% सुधार हुआ है, और विलंबता में कोई वृद्धि नहीं हुई है। दूसरे शब्दों में, इसे एक पूरा वेब एप्लिकेशन मॉड्यूल लिखने या जटिल कोड लॉजिक को डीबग करने के लिए कहना पहले से कहीं अधिक विश्वसनीय है।

यदि आपको गति की अधिक आवश्यकता है, तो Anthropic ने एक नया Claude 3.5 Haiku भी तैयार किया है – यह पिछली पीढ़ी के Haiku के समान कीमत और गति पर उपलब्ध है, लेकिन इसकी बुद्धिमत्ता बड़े भाई Claude 3 Opus से भी अधिक है। विशेष रूप से कोडिंग कार्यों में, Haiku ने SWE-bench Verified पर 40.6% स्कोर हासिल किया, जो मूल Claude 3.5 Sonnet और GPT-4 दोनों से बेहतर है। यह उन परिदृश्यों के लिए उपयुक्त है जहाँ तेज़ पुनरावृत्ति और बार-बार कॉल की आवश्यकता होती है, जैसे ऑटोमेटेड टेस्टिंग, लॉग एनालिसिस या कोड ऑटो-कम्प्लीशन।

डेवलपर्स इन नई क्षमताओं का उपयोग कैसे कर सकते हैं?

अपग्रेड किया गया Claude 3.5 Sonnet अब सभी उपयोगकर्ताओं के लिए उपलब्ध है। डेवलपर्स Anthropic API, Amazon Bedrock और Google Cloud के Vertex AI के माध्यम से कंप्यूटर ऑपरेशन फीचर (बीटा संस्करण) तक पहुँच सकते हैं। हालाँकि यह सुविधा अभी पूरी तरह से परिपूर्ण नहीं है – स्क्रॉल करना, ड्रैग-एंड-ड्रॉप, ज़ूम करना जैसी चीज़ें जो इंसानों के लिए बहुत आसान हैं, Claude अक्सर उनमें गलतियाँ करता है, और कभी-कभी लंबे समय तक स्क्रीन रिकॉर्डिंग के कारण कार्य बीच में ही रुक जाता है। लेकिन Asana, Canva, Replit जैसी कंपनियाँ पहले से ही इसका उपयोग दोहराए जाने वाले कार्यों को स्वचालित करने के लिए कर रही हैं, जैसे फॉर्म ऑटो-फिल करना या एप्लिकेशन इंटरफ़ेस की जाँच करना। Claude 3.5 Haiku महीने के अंत में आने की उम्मीद है, जो शुरुआत में केवल टेक्स्ट सपोर्ट करेगा और बाद में इमेज इनपुट जोड़ा जाएगा।

यदि आप एक डेवलपर हैं या अक्सर फॉर्म भरने और डेटा कॉपी करने जैसे छोटे-मोटे कामों से परेशान रहते हैं, तो एक बार Claude को अपने माउस क्लिक करने देने का प्रयास करें। हालाँकि यह अभी भी एक अनाड़ी नौसिखिए जैसा है, लेकिन इसकी प्रगति की गति पहले ही ध्यान देने योग्य है।

Claude कैसे इंसानों की तरह कंप्यूटर को नियंत्रित करता है?

कोडिंग क्षमता में भारी सुधार, कोड लिखना अधिक विश्वसनीय

डेवलपर्स इन नई क्षमताओं का उपयोग कैसे कर सकते हैं?

लेख खोजें

लोकप्रिय लेख

ChatGPT के सबसे उपयोगी कुछ प्रॉम्प्ट (Prompt): ऐसे तरीके जो सच में दक्षता 10 गुना बढ़ा दें

Claude Code की इंस्टॉलेशन हमेशा त्रुटि देती है: तीन चरणों में कॉन्फ़िगरेशन की समस्या हाथों-हाथ हल करें

ChatGPT Claude Gemini Midjourney के आउटपुट के “फेल” होने पर ट्रबलशूटिंग चेकलिस्ट और प्रॉम्प्ट के KISS टिप्स

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

ChatGPT和Claude总是答非所问三个提问技巧让AI秒懂你的需求

Claude की नई सुविधा: AI असिस्टेंट अब कंप्यूटर पर माउस और कीबोर्ड कंट्रोल कर सकता है

Claude कैसे इंसानों की तरह कंप्यूटर को नियंत्रित करता है?

कोडिंग क्षमता में भारी सुधार, कोड लिखना अधिक विश्वसनीय

डेवलपर्स इन नई क्षमताओं का उपयोग कैसे कर सकते हैं?

लेख खोजें

लोकप्रिय लेख

ChatGPT के सबसे उपयोगी कुछ प्रॉम्प्ट (Prompt): ऐसे तरीके जो सच में दक्षता 10 गुना बढ़ा दें

Claude Code की इंस्टॉलेशन हमेशा त्रुटि देती है: तीन चरणों में कॉन्फ़िगरेशन की समस्या हाथों-हाथ हल करें

ChatGPT Claude Gemini Midjourney के आउटपुट के “फेल” होने पर ट्रबलशूटिंग चेकलिस्ट और प्रॉम्प्ट के KISS टिप्स

ChatGPT Claude Gemini加Midjourney联动的高效工作流 解决输出不统一和改稿崩溃

ChatGPT和Claude总是答非所问 三个提问技巧让AI秒懂你的需求

ChatGPT Claude Gemini加Midjourney联动的高效工作流解决输出不统一和改稿崩溃

ChatGPT和Claude总是答非所问三个提问技巧让AI秒懂你的需求