क्या आपके साथ भी कभी ऐसा झुंझलाहट वाला पल आया है: वही एक जरूरत ChatGPT, Claude, Gemini को दे दो, तो जवाब का स्टाइल ऐसा बदलता है जैसे “बंदा ही बदल गया हो”; Midjourney तो और भी अजीब—प्रॉम्प्ट वही रहता है, लेकिन इमेज ऐसे निकलती है जैसे लकी-ड्रॉ चल रहा हो। अंदाज़े से गुस्सा करने के बजाय, मैं ज्यादा सुझाऊँगा कि बातचीत-विश्लेषण की सोच से AI का एक “हेल्थ चेक” कर लें और समस्या को आँकड़ों में माप लें।
संकेतक 1: समाधान दर—सिर्फ ये मत देखो कि उसने लंबा लिखा या नहीं
बातचीत-विश्लेषण में आम KPI “समाधान दर” होता है, सीधी भाषा में मतलब यह है कि इस बार का आउटपुट सीधे इस्तेमाल हो सकता है या नहीं। मेरा तरीका थोड़ा देसी है लेकिन असरदार: हर नतीजे पर टैग लगा दें—“सीधे डिलीवर किया जा सकता है / फॉलो-अप पूछना पड़ेगा / पूरी तरह विषय से भटका हुआ”। एक हफ्ते बाद आप साफ देख लेंगे: कौन ज्यादा स्थिर है, और कौन ज्यादा अपने ही में मगन रहता है।
संकेतक 2: रीवर्क (पुनःकार्य) की संख्या—‘जवाब कुछ और’ का इलाज
रीवर्क आपकी कमी नहीं है; मॉडल अक्सर शर्तें/बाधाएँ छोड़ देता है। आप जो बाद में जोड़ते हैं—“टेबल में आउटपुट दो”, “डेटा मत गढ़ो”, “चीनी में लिखो”—इन सबको नोट करें, और गिनें कि हर टूल को औसतन कितने अतिरिक्त वाक्य चाहिए होते हैं तब जाकर बात सही बैठती है।


