ChatGPT में हाल ही में कई बड़े अपडेट आए हैं, जो आम उपयोगकर्ताओं से लेकर AI पर अत्यधिक निर्भर रचनाकारों तक सभी के लिए जानने लायक हैं। अधिक प्राकृतिक आवाज संवाद से लेकर मल्टीमॉडल समझ तक, OpenAI ChatGPT को और अधिक लचीला और स्मार्ट बना रहा है। इस लेख में हम सबसे उल्लेखनीय नई सुविधाओं पर चर्चा करेंगे।
GPT-4o: सर्व-क्षमता वाला मल्टीमॉडल मॉडल
GPT-4o का लॉन्च ChatGPT के लिए एक मील का पत्थर है। यह न केवल टेक्स्ट को सपोर्ट करता है, बल्कि सीधे इमेज, ऑडियो और वीडियो कंटेंट को भी समझ सकता है। उदाहरण के लिए, आप एक डिज़ाइन स्केच अपलोड कर सकते हैं और इससे सुधार के सुझाव मांग सकते हैं, या एक मीटिंग की रिकॉर्डिंग दे सकते हैं ताकि यह अपने आप सारांश तैयार करे। GPT-4o की प्रतिक्रिया गति भी काफी बढ़ गई है, जो लगभग रियल-टाइम बातचीत के अनुभव के करीब है। पिछले GPT-4 की तुलना में, यह रीज़निंग और क्रिएटिव कार्यों में अधिक स्थिर प्रदर्शन करता है।
गौरतलब है कि Plus उपयोगकर्ता उच्च बुद्धिमत्ता स्तर की सेवा प्राप्त कर सकते हैं, जबकि मुफ्त उपयोगकर्ता मानक स्मार्ट मोड में बिना किसी सीमा के GPT-5 का उपयोग कर सकते हैं (दुरुपयोग रोकथाम तंत्र का ध्यान रखें)। यदि आपने अभी तक GPT-4o की मल्टीमॉडल क्षमता का अनुभव नहीं किया है, तो ChatGPT सेटिंग में मैन्युअल रूप से मॉडल बदलकर इसे आज़माने की सलाह दी जाती है।
Voice Engine: 15 सेकंड में अपनी आवाज़ क्लोन करें
OpenAI द्वारा लॉन्च किया गया Voice Engine आवाज की नकल को बेहद आसान बनाता है। बस 15 सेकंड का ऑडियो सैंपल देने पर, सिस्टम उस आवाज़ से मेल खाता हुआ आउटपुट उत्पन्न कर सकता है। यह सुविधा न केवल व्यक्तिगत वॉयस असिस्टेंट के लिए उपयोगी है, बल्कि भाषा सीखने वालों को उच्चारण सुधारने में भी मदद कर सकती है, या ऑडियो कंटेंट क्रिएटर्स के लिए एक सुविधाजनक वॉयसओवर समाधान प्रदान कर सकती है। वर्तमान में यह सुविधा कुछ क्षेत्रों में परीक्षण के तहत है, लेकिन इसमें भारी संभावनाएं दिख रही हैं।
बेहतर वॉयस मोड के साथ, आप सीधे प्राकृतिक आवाज में ChatGPT से बात कर सकते हैं, बिना टाइप किए सवाल पूछ सकते हैं, टोन बदल सकते हैं और कई दौर की बातचीत कर सकते हैं। Sam Altman ने वादा किया था कि नए वॉयस मोड की गुणवत्ता में उल्लेखनीय सुधार होगा, और वास्तविक अनुभव में यह अधिक सहज और प्राकृतिक लगता है।


