हाल के समय में, ChatGPT के अपडेट का मुख्य फोकस स्पष्ट है: 'बातचीत करने' को 'सुनने, देखने और फ़ाइलों को संसाधित करने' में बदलना। अधिक प्राकृतिक वॉइस संवाद से लेकर, सुविधाजनक डेस्कटॉप प्रवेश, और क्लाउड स्टोरेज से सीधे फ़ाइल ट्रांसफर तक, ChatGPT का उपयोग दैनिक कार्यप्रवाह के और करीब होता जा रहा है।
वॉइस मोड वास्तविक बातचीत जैसा: तेज़, स्थिर, और अधिक भावनात्मक विवरण
OpenAI ने कुछ उपयोगकर्ताओं के लिए उन्नत वॉइस मोड चरणबद्ध तरीके से शुरू किया है, ताकि ChatGPT की वॉइस प्रतिक्रियाएं अधिक यथार्थवादी हों, और लय व विराम पर भी ध्यान दें। आप इसे एक 'मौखिक चर्चा' के रूप में देख सकते हैं, जो चलते समय समीक्षा करने, गाड़ी चलाते समय रूपरेखा बनाने, या बैठक से पहले त्वरित प्रश्न-उत्तर सिमुलेशन के लिए उपयुक्त है। जिन लोगों को अंतर-भाषाई संचार की आवश्यकता है, उनके लिए, ChatGPT की त्वरित अनुवाद क्षमता के साथ, यह 'पोर्टेबल दुभाषिए' के अनुभव के और करीब है।
टेक्स्ट से ऑडियो-वीडियो तक: ChatGPT की मल्टीमॉडल क्षमताएं अधिक व्यावहारिक
GPT-4o की मल्टीमॉडल दिशा के आधार पर, ChatGPT अब सिर्फ टेक्स्ट प्रोसेस नहीं करता, बल्कि टेक्स्ट, इमेज और ऑडियो की समझ को एक ही संवाद में शामिल करता है। आप चित्र अपलोड कर ChatGPT से सामग्री समझा सकते हैं, दृश्यों का वर्णन करने में सहायता ले सकते हैं, या आवश्यकताओं को सीधे वॉइस में बता कर टेक्स्ट योजना जनरेट कर सकते हैं। आधिकारिक तौर पर वीडियो संबंधी क्षमताओं को आगे बढ़ाने की बात भी कही गई है, लेकिन समग्र रूप से चरणबद्ध खुलने पर जोर है, इसलिए इंटरफ़ेस में विकल्प दिखने पर उपयोग करना सुरक्षित रहेगा।


