Midjourney के हालिया प्रमुख अपडेट V6.1 मॉडल और क्रिएशन वर्कफ़्लो के ऑप्टिमाइज़ेशन पर केंद्रित हैं: इमेज अधिक सुसंगत है, टेक्सचर अधिक साफ़ हैं, टेक्स्ट जनरेशन भी अधिक भरोसेमंद है, और साथ ही लोकल री-ड्रॉ ने “फोटो-एडिटिंग जैसी आउटपुट प्रक्रिया” को और सहज बना दिया है। यह लेख Midjourney की इन नई सुविधाओं को अलग-अलग करके स्पष्ट करता है, और सीधे अपनाए जा सकने वाले उपयोग सुझाव देता है。
V6.1 मॉडल: किरदार अधिक सुसंगत, डिटेल्स अधिक देखने लायक
कई लोगों के लिए Midjourney में सबसे बड़ी परेशानी अंगों का बिगड़ना और चेहरे के फीचर्स का खिसकना होता है; V6.1 में बाँहों, टाँगों, हाथों आदि की संरचनात्मक निरंतरता वास्तव में अधिक स्थिर है, और कुल मिलाकर छवि की एकरूपता भी मजबूत है। साथ ही, Midjourney ने आम पिक्सेल-आर्टिफैक्ट्स कम किए हैं; त्वचा, कपड़े, धातु आदि के टेक्सचर अधिक सूक्ष्म हैं, और इमेज के “गंदे धब्बे” व नॉइज़ भी कम हैं。
अगर आप अक्सर हाफ-बॉडी पोर्ट्रेट या कैरेक्टर डिज़ाइन बनाते हैं, तो आँखों, छोटे चेहरे, और दूर के हाथों जैसे “सबसे आसानी से पकड़ में आ जाने वाले” क्षेत्रों में V6.1 पुराने मॉडल की तुलना में एक ही बार में उपयोगी ड्राफ्ट देना अधिक आसान बनाता है。
नया अपस्केलर: टेक्सचर अधिक स्पष्ट, आउटपुट की रफ्तार अधिक
Midjourney ने V6.1 में नया अपस्केलर (upscaler) जोड़ा है, जिसका लक्ष्य इमेज और टेक्सचर क्वालिटी को बढ़ाना है—खासकर उन पोस्टर, कॉन्सेप्ट आर्ट और ई-कॉमर्स मूड इमेज के लिए जो “डिलिवरेबल” क्वालिटी मांगते हैं। वास्तविक अनुभव यह है: उसी इमेज को बड़ा करने पर, डिटेल्स के किनारे अधिक साफ़ दिखते हैं और मटेरियल की परतें/ग्रेडेशन अधिक स्पष्ट होते हैं。
साथ ही, Midjourney की स्टैंडर्ड जनरेशन टास्क स्पीड भी बढ़ी है; आधिकारिक दावा लगभग 25% का है। हाई-फ़्रीक्वेंसी इटरेशन करने वालों के लिए यह सिर्फ़ दिखावा नहीं—यह सीधे इंतज़ार और बार-बार कतार में लगने की समय-लागत घटाता है。
टेक्स्ट जनरेशन अधिक सटीक: दिखाए जाने वाले शब्दों को उद्धरण चिह्नों से लॉक करें
पहले Midjourney से टेक्स्ट वाले पोस्टर बनाते समय सबसे बड़ी समस्या थी “अक्षर जैसे दिखते हैं, पर अक्षर होते नहीं”。 V6.1 में टेक्स्ट की सटीकता स्पष्ट रूप से बढ़ी है, खासकर जब आप प्रॉम्प्ट में उद्धरण चिह्नों के भीतर वह सामग्री लिखते हैं जो आपको दिखानी है—तो Midjourney के लिए अनुरूप टेक्स्ट बनाना आसान हो जाता है。
सुझावित तरीका यह है कि टेक्स्ट को इमेज के एक एलिमेंट की तरह वर्णित करें: जैसे “पोस्टर का शीर्षक ‘NEW CITY’ है, sans-serif फ़ॉन्ट, केंद्र में”。 Midjourney में अब भी कभी-कभी स्पेलिंग में हल्का विचलन हो सकता है, लेकिन पुराने संस्करण की तुलना में शुरुआती ड्राफ्ट के लिए इसे आज़माना अधिक उचित है。
--q 2 मोड और लोकल री-ड्रॉ: गुणवत्ता को मुख्य हिस्सों पर खर्च करें
V6.1 में नया --q 2 मोड जोड़ा गया है; यह अधिक समय लेकर अधिक समृद्ध टेक्सचर डिटेल्स देता है, और चमड़ा, फर/बाल, बुना हुआ कपड़ा, भोजन आदि की मटेरियल-प्रस्तुति के लिए उपयुक्त है। लेकिन ध्यान रहे: टेक्सचर क्वालिटी के पीछे भागते हुए Midjourney कभी-कभी स्थानीय सुसंगति को थोड़ा-सा बलिदान कर देता है, इसलिए इसे स्टिल-लाइफ़, मूड सीन या क्लोज़-अप शॉट्स में उपयोग करना अधिक अनुशंसित है。
इसके अलावा, लोकल री-ड्रॉ (क्षेत्रीय री-ड्रॉ) ने Midjourney में “पूरी इमेज दोबारा किए बिना सिर्फ़ हिस्सा बदलना” को एक नियमित ऑपरेशन बना दिया है: आप जिस हिस्से को बदलना है उसे चुनकर सिर्फ़ उसी हिस्से को री-ड्रॉ कर सकते हैं, और प्रॉम्प्ट से जोड़ सकते हैं जैसे “उँगलियों को प्राकृतिक पाँच उँगलियों में बदलो”, “बैकग्राउंड के राहगीरों को हटाओ”, “कॉलर को हाई-नेक स्वेटर में बदलो” आदि। हिट-रेट बढ़ाने के लिए, प्रॉम्प्ट में जितना संभव हो सिर्फ़ री-ड्रॉ होने वाले हिस्से का ही वर्णन करें, पूरी इमेज की स्टाइल फिर से न दोहराएँ—ताकि Midjourney की कंप्यूटिंग शक्ति उसी जगह लगे जिसे आप वास्तव में बदलना चाहते हैं。