हैदराबाद : ड्यूक यूनिवर्सिटी के शोधकर्ताओं ने एक आर्टिफिशियल इंटेलिजेंस (एआई) उपकरण विकसित किया है, जो लोगों के चेहरे की धुंधली, पहचानने योग्य तस्वीरों को पहले से कहीं ज्यादा बारीक तरीके से कंप्यूटर जनित पोर्ट्रेट में बदल सकता है. पिछली विधियां अपने मूल रिजॉल्यूशन से चेहरे की छवि को आठ गुना तक बढ़ा सकती हैं, लेकिन ड्यूक टीम मुट्ठी भर पिक्सेल लेने और 64 बार रिजॉल्यूशन के साथ यथार्थवादी दिखने वाले चेहरे बनाने का एक तरीका लेकर आई है, जिसमें फाइनेंशियल फीचर्स जैसे फाइन लाइन्स, आईलैशेज और स्टबल शामिल हैं जो पहले नहीं थे.
ड्यूक कंप्यूटर वैज्ञानिक सिंथिया रुडिन ने कहा कि इस प्रतिज्ञा से पहले कभी भी सुपर-रिजॉल्यूशन चित्र इस विस्तार के साथ नहीं बनाए गए हैं. सिस्टम का उपयोग लोगों की पहचान करने के लिए नहीं किया जा सकता है. शोधकर्ताओं का कहना है कि यह एक सुरक्षा कैमरे से एक वास्तविक व्यक्ति के क्रिस्टल स्पष्ट छवि में एक आउट ऑफ फोकस, अपरिचित फोटो को चालू नहीं करेगा. बल्कि यह नए चेहरों को उत्पन्न करने में सक्षम है जो मौजूद नहीं हैं, लेकिन वास्तविक रूप से वास्तविक हैं.
हालांकि शोधकर्ताओं ने अवधारणा के प्रमाण के रूप में चेहरों पर ध्यान केंद्रित किया, वही तकनीक सिद्धांत में तरीबन किसी भी चीज के कम-रे शॉट्स ले सकती है और दवा और माइक्रोस्कोपी से लेकर खगोल विज्ञान और उपग्रह इमेजरी तक के अनुप्रयोगों के साथ तेज, यथार्थवादी दिखने वाली तस्वीरें बना सकती है. शोधकर्ता अगले हफ्ते 2020 जून से 14 जून तक आयोजित कंप्यूटर विजन एंड पैटर्न रिकॉग्निशन (सीवीपीआर) पर 19 सम्मेलन में अगले सप्ताह पल्स नामक अपनी पद्धति प्रस्तुत करेंगे.
पारंपरिक दृष्टिकोण एक कम-रिजॉल्यूशन छवि लेते हैं और अनुमान लगाते हैं कि उन्हें अतिरिक्त मिलान के लिए अतिरिक्त पिक्सेल की क्या आवश्यकता है, औसतन उच्च रिजॉल्यूशन वाले पिक्सेल में, जो कंप्यूटर ने पहले देखा है. इस औसत के परिणामस्वरूप बालों और त्वचा में बनावट वाले क्षेत्र जो एक पिक्सेल से अगले छोर तक पूरी तरह से लाइन नहीं हो सकते हैं जो फर्जी और अविवेकी दिखते हैं.
ड्यूक टीम एक अलग दृष्टिकोण के साथ आई कम-रिजॉल्यूशन वाली छवि लेने और धीरे-धीरे नई डिटेल जोड़ने के बजाय, सिस्टम उच्च-रिजॉल्यूशन वाले चेहरों के एआई जेनरेट किए गए उदाहरणों को तोड़ता है, उन लोगों को खोजता है जो एक ही आकार में सिकुड़ जाने पर इनपुट छवि की तरह संभव हो.
टीम ने मशीन लर्निंग में एक टूल का इस्तेमाल किया, जिसे जेनरेटरी एडवरसरी नेटवर्क कहा जाता है, जो दो न्यूरल नेटवर्क हैं जो तस्वीरों के एक ही डेटा सेट पर प्रशिक्षित होते हैं. एक नेटवर्क एआई निर्मित मानव चेहरों के साथ आता है जो उन लोगों की नकल करते हैं जिन्हें यह प्रशिक्षित किया गया था, जबकि दूसरा यह आउटपुट लेता है और यह तय करता है कि क्या यह वास्तविक चीज के लिए गलत होने के लिए पर्याप्त रूप से आश्वस्त है. पहला नेटवर्क अनुभव के साथ बेहतर और बेहतर हो जाता है, जब तक कि दूसरा नेटवर्क अंतर नहीं बता सकता.
रूल ने कहा कि शोरगुल, खराब गुणवत्ता वाले इनपुट से पल्स यथार्थवादी-चित्र बना सकता है, जो अन्य तरीके नहीं कर सकते. चेहरे की एकल धुंधली छवि से यह किसी भी तरह की अस्वाभाविक जीवनरेखा संभावनाओं को थूक सकता है, जिनमें से प्रत्येक एक अलग व्यक्ति की तरह सूक्ष्म रूप से दिखता है.
ड्यूक गणित प्रमुख, सह-लेखक एलेक्स डेमियन 20 ने कहा कि यहां तक कि आंखों और मुंह को देखने वाली तस्वीरें भी दी जा सकती हैं. उन्होंने कहा कि हमारे एल्गोरिथ्म अभी भी इसके साथ कुछ करने का प्रबंधन करते हैं, जो पारंपरिक दृष्टिकोणों को नहीं कर सकता है.
सिस्टम एक चेहरे की 16 × 16-पिक्सेल छवि को कुछ ही सेकंड में एक लाख पिक्सेल से अधिक जोड़कर कुछ ही सेकंड में 1024 x 1024 पिक्सेल में बदल सकता है. कम आकार के फोटो में अपरिपक्व होने वाले बालों के छिद्र, झुर्रियां और वार जैसे विवरण कंप्यूटर द्वारा तैयार किए गए संस्करणों में क्रिस्प और स्पष्ट हो जाते हैं.
शोधकर्ताओं ने 40 लोगों को एक से पांच के पैमाने पर पल्स और पांच अन्य स्केलिंग विधियों के माध्यम से उत्पन्न 1,440 छवियों को रेट करने के लिए कहा और पल्स ने सबसे अच्छा किया, वास्तविक लोगों की उच्च-गुणवत्ता वाली तस्वीरों के रूप में लगभग उच्च स्कोर किया.