Titikey
होम实用技巧ClaudeClaude 3.5 Sonnet की नई खूबियों का विस्तृत विश्लेषण: कंप्यूटर संचालन क्षमता और टूल-कॉलिंग अपग्रेड

Claude 3.5 Sonnet की नई खूबियों का विस्तृत विश्लेषण: कंप्यूटर संचालन क्षमता और टूल-कॉलिंग अपग्रेड

19/3/2026
Claude

इस बार Claude 3.5 Sonnet में सबसे ज़्यादा ध्यान देने लायक नया बदलाव यह है कि मॉडल को “स्क्रीन समझने और माउस चलाने” की दिशा में बढ़ाया गया है, यानी प्राकृतिक भाषा निर्देशों को वास्तविक कंप्यूटर ऑपरेशन वर्कफ़्लो में बदला जा सकता है। जिन लोगों को स्प्रेडशीट ऑटोमेशन, वेब डेटा एंट्री, और सामग्री/डेटा व्यवस्थित करने की ज़रूरत होती है, उनके लिए Claude 3.5 Sonnet की उपयोग-सीमा स्पष्ट रूप से बढ़ गई है।

Claude 3.5 Sonnet की “कंप्यूटर चलाने की क्षमता” आखिर है क्या

Claude 3.5 Sonnet में डेवलपर्स के लिए कंप्यूटर ऑपरेशन से जुड़ी API-आधारित सोच जोड़ी गई है: पहले कंप्यूटर इंटरफ़ेस को महसूस/समझना (जैसे स्क्रीनशॉट/इंटरफ़ेस स्टेट), फिर आपकी मांग को ऐसे कदमों में तोड़ना जिन्हें निष्पादित किया जा सके। यह “ब्राउज़र खोलें—पेज पर जाएँ—इनपुट बॉक्स ढूँढें—फ़ॉर्म भरें—सबमिट करें” जैसी एंड-टू-एंड कड़ी को चरण-दर-चरण पूरा कर सकता है, ताकि काम सिर्फ़ टेक्स्ट सुझावों तक सीमित न रहे।

इस क्षमता का मूल “इंटरनेट चलाना आता है या नहीं” नहीं, बल्कि “इंटरफ़ेस के अनुसार काम करना आता है या नहीं” है। Claude 3.5 Sonnet को इस तरह डिज़ाइन किया गया है कि वह बहु-चरणीय प्रक्रियाओं में लगातार निर्णय ले सके और गलतियों को सुधार सके, इसलिए बार-बार होने वाले, बिखरे हुए और गलती-प्रवण काम ऑटोमेशन को सौंपने के लिए उपयुक्त है।

किन परिदृश्यों के लिए अधिक उपयुक्त: स्प्रेडशीट, बैकएंड, टेस्टिंग और दोहराए जाने वाले वर्कफ़्लो

अगर आपका काम अक्सर “कॉपी-पेस्ट + बार-बार पेज बदलने” में अटकता है, तो Claude 3.5 Sonnet अधिक मूल्यवान होगा: स्थानीय सामग्री से फ़ील्ड निकालकर ऑनलाइन फ़ॉर्म या स्प्रेडशीट में भरना; बैकएंड सिस्टम में तय पाथ के अनुसार जानकारी दर्ज करना; एक ही प्रक्रिया को अलग-अलग ग्राहकों या अलग-अलग डेटा बैच के लिए बार-बार चलाना।

डेवलपमेंट टीमों के लिए भी Claude 3.5 Sonnet “टूल्स के साथ निष्पादक” के रूप में अधिक उपयुक्त है—उदाहरण के लिए टेस्ट एनवायरनमेंट में चरण-दर-चरण क्लिक करना, पेज की स्थिति सत्यापित करना, परिणाम रिकॉर्ड करना, और फिर असामान्य बिंदुओं को सूची के रूप में वापस लिखना।

प्रोग्रामिंग और टूल उपयोग भी साथ-साथ मजबूत

कंप्यूटर ऑपरेट करने के अलावा, Claude 3.5 Sonnet ने प्रोग्रामिंग और टूल-उपयोग वाले कार्यों में भी सुधार किया है। आधिकारिक तौर पर कहा गया है कि HumanEval, SWE-bench Verified जैसी बेंचमार्क परीक्षाओं में इसमें स्पष्ट बढ़त दिखी है। आपके लिए सबसे प्रत्यक्ष असर यह है: Claude 3.5 Sonnet प्रतिबंधों/कंस्ट्रेंट्स के अनुसार चलने वाला रन करने योग्य कोड देने के लिए अधिक तैयार रहता है, इंटरफ़ेस फ़ॉर्मैट का बेहतर पालन करता है, और बहु-चरणीय आवश्यकताओं में भटकने की संभावना कम होती है।

अगर आप Claude 3.5 Sonnet को “प्रोजेक्ट सहयोगी” मानते हैं, तो सलाह है कि काम को इस तरह तोड़ें: लक्ष्य, इनपुट, आउटपुट, क्या नहीं करना है, और स्वीकृति मानदंड। इससे टूल कॉल करने, कोड जनरेट करने और बॉउंडरी कंडीशंस पूरा करने में इसकी स्थिरता बढ़ती है।

ज्ञात सीमाएँ और उपयोग सुझाव: एक बार में परफ़ेक्ट होने की उम्मीद न करें

Claude 3.5 Sonnet की कंप्यूटर ऑपरेशन क्षमता अभी शुरुआती चरण में है; स्क्रॉलिंग, ड्रैग-एंड-ड्रॉप, ज़ूम जैसी इंसानी तौर पर सहज क्रियाएँ मॉडल के लिए अब भी कठिन हो सकती हैं। वास्तविक परीक्षणों में गलत ऑपरेशन के कारण लंबे समय वाले कार्य के बीच में रुक जाने की स्थिति भी देखी गई है, इसलिए महत्वपूर्ण ऑपरेशनों के लिए कन्फर्मेशन स्टेप्स और रोलबैक रणनीति जोड़ने की सलाह दी जाती है।

Claude 3.5 Sonnet को अधिक स्थिर तरीके से इस्तेमाल करने के लिए, “एक्शन” को छोटी-छोटी वाक्य-सूची में लिखें, और उससे कहें कि हर दो-तीन कदम के बाद वर्तमान इंटरफ़ेस स्थिति रिपोर्ट करे। इससे अगर कोई कदम विफल भी हो जाए, तो जल्दी पता चल जाता है कि वह किस पेज, किस कंट्रोल, या किस परमिशन पॉप-अप पर अटका है।

कैसे प्राप्त करें और लागू करें: छोटे वर्कफ़्लो से शुरुआत करें

Claude 3.5 Sonnet को API और क्लाउड प्लेटफ़ॉर्म चैनलों के माध्यम से इस्तेमाल किया जा सकता है। बेहतर है कि पहले “छोटे और तय” वर्कफ़्लो से शुरुआत करें—जैसे किसी निश्चित वेबसाइट के फ़ॉर्म को भरना, या निश्चित फ़ील्ड्स के साथ स्प्रेडशीट अपडेट करना। जब आप पेज संरचना, अपवाद शाखाओं और परमिशन पॉप-अप्स को अच्छी तरह समझ लें, तब धीरे-धीरे अधिक खुले कार्यों तक विस्तार करें।

अगर आप Claude 3.5 Sonnet को प्रोडक्शन एनवायरनमेंट में जोड़ना चाहते हैं, तो बाहरी परत में ही परमिशन कंट्रोल, ऑपरेशन व्हाइटलिस्ट, और संवेदनशील पेजों की ब्लॉकिंग ज़रूर लागू करें, ताकि Claude 3.5 Sonnet सिर्फ़ अनुमत दायरे में ही निष्पादन करे—और “काम कर पाना” वास्तव में “सुरक्षित तरीके से काम कर पाना” बन जाए।