Claude 3.5 के इस अपडेट में सबसे आकर्षक बात यह है कि यह “सिर्फ चैट” से आगे बढ़कर “काम करके दिखाने” की दिशा में जाता है। सार्वजनिक बीटा में Claude 3.5 स्क्रीन का कंटेंट देख सकता है, कर्सर को मूव कर सकता है, बटन क्लिक कर सकता है और इनपुट बॉक्स में टाइप करके चरण-दर-चरण (step-by-step) टास्क पूरे कर सकता है। नीचे एडिटर के नजरिए से Claude 3.5 के बदलाव स्पष्ट किए गए हैं, ताकि आप समझ सकें कि इसे तुरंत हाथ में लेना वाकई जरूरी है या नहीं।
Claude 3.5 में नया “कंप्यूटर उपयोग” (Computer Use): यह क्या कर सकता है
“कंप्यूटर उपयोग” से मतलब है: आप Claude 3.5 को एक लक्ष्य (goal) देते हैं, और वह इंसान की तरह इंटरफेस के फ्लो के अनुसार काम करता है—पहले स्क्रीन देखता है, फिर तय करता है कि कहाँ क्लिक करना है और क्या टाइप करना है। यह उन कामों के लिए उपयुक्त है जिनमें बहुत सारे ऑपरेशन स्टेप्स होते हैं, जैसे वेब एडमिन पैनल में एक-एक करके जानकारी भरना, या A पेज से डेटा समेटकर B फॉर्म में व्यवस्थित करना। आधिकारिक तौर पर यह भी साफ कहा गया है कि यह अभी प्रयोगात्मक क्षमता है; Claude 3.5 कभी-कभी गलती से गलत जगह क्लिक कर सकता है या कुछ स्टेप्स छूट सकते हैं, इसलिए आपको बीच-बीच में सुधार (correction) करना पड़ सकता है।
उपलब्धता: API में पब्लिक बीटा, मल्टी-प्लेटफ़ॉर्म सपोर्ट
फिलहाल Claude 3.5 का कंप्यूटर उपयोग फीचर API के पब्लिक बीटा के रूप में उपलब्ध है, जिसे डेवलपर्स सीधे Anthropic API पर बनाकर इस्तेमाल कर सकते हैं। साथ ही Claude 3.5 को Amazon Bedrock और Google Cloud के Vertex AI पर भी उपयोग किया जा सकता है, जिससे एंटरप्राइज़ अपनी मौजूदा क्लाउड आर्किटेक्चर के हिसाब से इसे आसानी से इंटीग्रेट कर सकते हैं। टीमों के लिए इसका मतलब यह है कि Claude 3.5 सिर्फ डेमो या “खिलौना” नहीं है, बल्कि इसे प्रोसेस सिस्टम में जोड़कर ऑटोमेशन की तरह इस्तेमाल करने की दिशा में ले जाया जा सकता है।

