ETV Bharat / bharat

आर्टिफिशियल इंटेलिजेंस से धुंधले चेहरे 60 गुना से ज्यादा शार्प दिखेंगे - 60 गुना से ज्यादा शार्प य

ड्यूक यूनिवर्सिटी के शोधकर्ताओं ने एक एआई उपकरण विकसित किया है, जो लोगों के चेहरे की धुंधली, पहचानने योग्य तस्वीरों को पहले से कहीं ज्यादा बारीक तरीके से कंप्यूटर जनित पोर्ट्रेट में बदल सकता है. जानें विस्तार से...

.etvbharat.
कॉन्सेप्ट इमेज.
author img

By

Published : Jun 16, 2020, 4:56 AM IST

Updated : Jun 16, 2020, 12:52 PM IST

हैदराबाद : ड्यूक यूनिवर्सिटी के शोधकर्ताओं ने एक आर्टिफिशियल इंटेलिजेंस (एआई) उपकरण विकसित किया है, जो लोगों के चेहरे की धुंधली, पहचानने योग्य तस्वीरों को पहले से कहीं ज्यादा बारीक तरीके से कंप्यूटर जनित पोर्ट्रेट में बदल सकता है. पिछली विधियां अपने मूल रिजॉल्यूशन से चेहरे की छवि को आठ गुना तक बढ़ा सकती हैं, लेकिन ड्यूक टीम मुट्ठी भर पिक्सेल लेने और 64 बार रिजॉल्यूशन के साथ यथार्थवादी दिखने वाले चेहरे बनाने का एक तरीका लेकर आई है, जिसमें फाइनेंशियल फीचर्स जैसे फाइन लाइन्स, आईलैशेज और स्टबल शामिल हैं जो पहले नहीं थे.

ड्यूक कंप्यूटर वैज्ञानिक सिंथिया रुडिन ने कहा कि इस प्रतिज्ञा से पहले कभी भी सुपर-रिजॉल्यूशन चित्र इस विस्तार के साथ नहीं बनाए गए हैं. सिस्टम का उपयोग लोगों की पहचान करने के लिए नहीं किया जा सकता है. शोधकर्ताओं का कहना है कि यह एक सुरक्षा कैमरे से एक वास्तविक व्यक्ति के क्रिस्टल स्पष्ट छवि में एक आउट ऑफ फोकस, अपरिचित फोटो को चालू नहीं करेगा. बल्कि यह नए चेहरों को उत्पन्न करने में सक्षम है जो मौजूद नहीं हैं, लेकिन वास्तविक रूप से वास्तविक हैं.

हालांकि शोधकर्ताओं ने अवधारणा के प्रमाण के रूप में चेहरों पर ध्यान केंद्रित किया, वही तकनीक सिद्धांत में तरीबन किसी भी चीज के कम-रे शॉट्स ले सकती है और दवा और माइक्रोस्कोपी से लेकर खगोल विज्ञान और उपग्रह इमेजरी तक के अनुप्रयोगों के साथ तेज, यथार्थवादी दिखने वाली तस्वीरें बना सकती है. शोधकर्ता अगले हफ्ते 2020 जून से 14 जून तक आयोजित कंप्यूटर विजन एंड पैटर्न रिकॉग्निशन (सीवीपीआर) पर 19 सम्मेलन में अगले सप्ताह पल्स नामक अपनी पद्धति प्रस्तुत करेंगे.

पारंपरिक दृष्टिकोण एक कम-रिजॉल्यूशन छवि लेते हैं और अनुमान लगाते हैं कि उन्हें अतिरिक्त मिलान के लिए अतिरिक्त पिक्सेल की क्या आवश्यकता है, औसतन उच्च रिजॉल्यूशन वाले पिक्सेल में, जो कंप्यूटर ने पहले देखा है. इस औसत के परिणामस्वरूप बालों और त्वचा में बनावट वाले क्षेत्र जो एक पिक्सेल से अगले छोर तक पूरी तरह से लाइन नहीं हो सकते हैं जो फर्जी और अविवेकी दिखते हैं.

ड्यूक टीम एक अलग दृष्टिकोण के साथ आई कम-रिजॉल्यूशन वाली छवि लेने और धीरे-धीरे नई डिटेल जोड़ने के बजाय, सिस्टम उच्च-रिजॉल्यूशन वाले चेहरों के एआई जेनरेट किए गए उदाहरणों को तोड़ता है, उन लोगों को खोजता है जो एक ही आकार में सिकुड़ जाने पर इनपुट छवि की तरह संभव हो.

टीम ने मशीन लर्निंग में एक टूल का इस्तेमाल किया, जिसे जेनरेटरी एडवरसरी नेटवर्क कहा जाता है, जो दो न्यूरल नेटवर्क हैं जो तस्वीरों के एक ही डेटा सेट पर प्रशिक्षित होते हैं. एक नेटवर्क एआई निर्मित मानव चेहरों के साथ आता है जो उन लोगों की नकल करते हैं जिन्हें यह प्रशिक्षित किया गया था, जबकि दूसरा यह आउटपुट लेता है और यह तय करता है कि क्या यह वास्तविक चीज के लिए गलत होने के लिए पर्याप्त रूप से आश्वस्त है. पहला नेटवर्क अनुभव के साथ बेहतर और बेहतर हो जाता है, जब तक कि दूसरा नेटवर्क अंतर नहीं बता सकता.

रूल ने कहा कि शोरगुल, खराब गुणवत्ता वाले इनपुट से पल्स यथार्थवादी-चित्र बना सकता है, जो अन्य तरीके नहीं कर सकते. चेहरे की एकल धुंधली छवि से यह किसी भी तरह की अस्वाभाविक जीवनरेखा संभावनाओं को थूक सकता है, जिनमें से प्रत्येक एक अलग व्यक्ति की तरह सूक्ष्म रूप से दिखता है.

ड्यूक गणित प्रमुख, सह-लेखक एलेक्स डेमियन 20 ने कहा कि यहां तक ​​कि आंखों और मुंह को देखने वाली तस्वीरें भी दी जा सकती हैं. उन्होंने कहा कि हमारे एल्गोरिथ्म अभी भी इसके साथ कुछ करने का प्रबंधन करते हैं, जो पारंपरिक दृष्टिकोणों को नहीं कर सकता है.

सिस्टम एक चेहरे की 16 × 16-पिक्सेल छवि को कुछ ही सेकंड में एक लाख पिक्सेल से अधिक जोड़कर कुछ ही सेकंड में 1024 x 1024 पिक्सेल में बदल सकता है. कम आकार के फोटो में अपरिपक्व होने वाले बालों के छिद्र, झुर्रियां और वार जैसे विवरण कंप्यूटर द्वारा तैयार किए गए संस्करणों में क्रिस्प और स्पष्ट हो जाते हैं.

शोधकर्ताओं ने 40 लोगों को एक से पांच के पैमाने पर पल्स और पांच अन्य स्केलिंग विधियों के माध्यम से उत्पन्न 1,440 छवियों को रेट करने के लिए कहा और पल्स ने सबसे अच्छा किया, वास्तविक लोगों की उच्च-गुणवत्ता वाली तस्वीरों के रूप में लगभग उच्च स्कोर किया.

हैदराबाद : ड्यूक यूनिवर्सिटी के शोधकर्ताओं ने एक आर्टिफिशियल इंटेलिजेंस (एआई) उपकरण विकसित किया है, जो लोगों के चेहरे की धुंधली, पहचानने योग्य तस्वीरों को पहले से कहीं ज्यादा बारीक तरीके से कंप्यूटर जनित पोर्ट्रेट में बदल सकता है. पिछली विधियां अपने मूल रिजॉल्यूशन से चेहरे की छवि को आठ गुना तक बढ़ा सकती हैं, लेकिन ड्यूक टीम मुट्ठी भर पिक्सेल लेने और 64 बार रिजॉल्यूशन के साथ यथार्थवादी दिखने वाले चेहरे बनाने का एक तरीका लेकर आई है, जिसमें फाइनेंशियल फीचर्स जैसे फाइन लाइन्स, आईलैशेज और स्टबल शामिल हैं जो पहले नहीं थे.

ड्यूक कंप्यूटर वैज्ञानिक सिंथिया रुडिन ने कहा कि इस प्रतिज्ञा से पहले कभी भी सुपर-रिजॉल्यूशन चित्र इस विस्तार के साथ नहीं बनाए गए हैं. सिस्टम का उपयोग लोगों की पहचान करने के लिए नहीं किया जा सकता है. शोधकर्ताओं का कहना है कि यह एक सुरक्षा कैमरे से एक वास्तविक व्यक्ति के क्रिस्टल स्पष्ट छवि में एक आउट ऑफ फोकस, अपरिचित फोटो को चालू नहीं करेगा. बल्कि यह नए चेहरों को उत्पन्न करने में सक्षम है जो मौजूद नहीं हैं, लेकिन वास्तविक रूप से वास्तविक हैं.

हालांकि शोधकर्ताओं ने अवधारणा के प्रमाण के रूप में चेहरों पर ध्यान केंद्रित किया, वही तकनीक सिद्धांत में तरीबन किसी भी चीज के कम-रे शॉट्स ले सकती है और दवा और माइक्रोस्कोपी से लेकर खगोल विज्ञान और उपग्रह इमेजरी तक के अनुप्रयोगों के साथ तेज, यथार्थवादी दिखने वाली तस्वीरें बना सकती है. शोधकर्ता अगले हफ्ते 2020 जून से 14 जून तक आयोजित कंप्यूटर विजन एंड पैटर्न रिकॉग्निशन (सीवीपीआर) पर 19 सम्मेलन में अगले सप्ताह पल्स नामक अपनी पद्धति प्रस्तुत करेंगे.

पारंपरिक दृष्टिकोण एक कम-रिजॉल्यूशन छवि लेते हैं और अनुमान लगाते हैं कि उन्हें अतिरिक्त मिलान के लिए अतिरिक्त पिक्सेल की क्या आवश्यकता है, औसतन उच्च रिजॉल्यूशन वाले पिक्सेल में, जो कंप्यूटर ने पहले देखा है. इस औसत के परिणामस्वरूप बालों और त्वचा में बनावट वाले क्षेत्र जो एक पिक्सेल से अगले छोर तक पूरी तरह से लाइन नहीं हो सकते हैं जो फर्जी और अविवेकी दिखते हैं.

ड्यूक टीम एक अलग दृष्टिकोण के साथ आई कम-रिजॉल्यूशन वाली छवि लेने और धीरे-धीरे नई डिटेल जोड़ने के बजाय, सिस्टम उच्च-रिजॉल्यूशन वाले चेहरों के एआई जेनरेट किए गए उदाहरणों को तोड़ता है, उन लोगों को खोजता है जो एक ही आकार में सिकुड़ जाने पर इनपुट छवि की तरह संभव हो.

टीम ने मशीन लर्निंग में एक टूल का इस्तेमाल किया, जिसे जेनरेटरी एडवरसरी नेटवर्क कहा जाता है, जो दो न्यूरल नेटवर्क हैं जो तस्वीरों के एक ही डेटा सेट पर प्रशिक्षित होते हैं. एक नेटवर्क एआई निर्मित मानव चेहरों के साथ आता है जो उन लोगों की नकल करते हैं जिन्हें यह प्रशिक्षित किया गया था, जबकि दूसरा यह आउटपुट लेता है और यह तय करता है कि क्या यह वास्तविक चीज के लिए गलत होने के लिए पर्याप्त रूप से आश्वस्त है. पहला नेटवर्क अनुभव के साथ बेहतर और बेहतर हो जाता है, जब तक कि दूसरा नेटवर्क अंतर नहीं बता सकता.

रूल ने कहा कि शोरगुल, खराब गुणवत्ता वाले इनपुट से पल्स यथार्थवादी-चित्र बना सकता है, जो अन्य तरीके नहीं कर सकते. चेहरे की एकल धुंधली छवि से यह किसी भी तरह की अस्वाभाविक जीवनरेखा संभावनाओं को थूक सकता है, जिनमें से प्रत्येक एक अलग व्यक्ति की तरह सूक्ष्म रूप से दिखता है.

ड्यूक गणित प्रमुख, सह-लेखक एलेक्स डेमियन 20 ने कहा कि यहां तक ​​कि आंखों और मुंह को देखने वाली तस्वीरें भी दी जा सकती हैं. उन्होंने कहा कि हमारे एल्गोरिथ्म अभी भी इसके साथ कुछ करने का प्रबंधन करते हैं, जो पारंपरिक दृष्टिकोणों को नहीं कर सकता है.

सिस्टम एक चेहरे की 16 × 16-पिक्सेल छवि को कुछ ही सेकंड में एक लाख पिक्सेल से अधिक जोड़कर कुछ ही सेकंड में 1024 x 1024 पिक्सेल में बदल सकता है. कम आकार के फोटो में अपरिपक्व होने वाले बालों के छिद्र, झुर्रियां और वार जैसे विवरण कंप्यूटर द्वारा तैयार किए गए संस्करणों में क्रिस्प और स्पष्ट हो जाते हैं.

शोधकर्ताओं ने 40 लोगों को एक से पांच के पैमाने पर पल्स और पांच अन्य स्केलिंग विधियों के माध्यम से उत्पन्न 1,440 छवियों को रेट करने के लिए कहा और पल्स ने सबसे अच्छा किया, वास्तविक लोगों की उच्च-गुणवत्ता वाली तस्वीरों के रूप में लगभग उच्च स्कोर किया.

Last Updated : Jun 16, 2020, 12:52 PM IST
ETV Bharat Logo

Copyright © 2024 Ushodaya Enterprises Pvt. Ltd., All Rights Reserved.