ડરહમ (નોર્થ કેલિફોર્નિયા): અગાઉની પદ્ધતિઓમાં તસવીરને તેના મૂળ રેઝોલ્યુશન કરતાં આઠ ગણો વધુ સ્પષ્ટ બનાવી શકાતો હતો. પરંતુ ડ્યુક યુનિવર્સિટીની ટીમે કેટલાક પિક્સલ્સની મદદથી મૂળ રેઝોલ્યુશન કરતાં 64 ગણો વધુ સ્પષ્ટ, વાસ્તવિક લાગે તેવો ચહેરો બનાવતું ટૂલ વિકસાવ્યું છે. ઈમેજિંનિંગના આ ટૂલમાં ફાઈન લાઈન્સ, આઈલેશીઝ અને સ્ટબલ જેવાં ફીચર્સ છે, જે અગાઉ ક્યારેય ઉપયોગમાં લેવાયા ન હતાં.
સંશોધન ટીમનું નેતૃત્ત્વ કરી રહેલા ડ્યુક યુનિવર્સિટીના કોમ્પ્યુટર સાયન્ટિસ્ટ સિન્થિયા રુડિને જણાવ્યું કે આટલી બારીકાઈપૂર્વક અગાઉ ક્યારેય કોઈ આટલી હદે ધૂંધળી તસવીરને આટલી બધી સ્પષ્ટ બનાવી શકાઈ નથી.
સંશોધકો કહે છે કે સિસ્ટમનો ઉપયોગ લોકોના ચહેરા ઓળખી શકાતો નથી. તેનાથી સિક્યોરિટી કેમેરામાંથી ધૂંધળા દેખાતા ફોટોગ્રાફને તદ્દન સ્પષ્ટ સાચા માણસના ફોટોગ્રાફમાં પરિવર્તિત કરી શકાતો નથી. તેના બદલે આ સિસ્ટમ નવા ચહેરાઓ પેદા કરવામાં સક્ષમ છે, જે અસ્તિત્ત્વ જ ધરાવતા ન હોય, પરંતુ બુદ્ધિગમ્ય રીતે તે વાસ્તવિક લાગે.
સંશોધકોએ અભિગમના પુરાવા તરીકે ચહેરા ઉપર ધ્યાન કેન્દ્રિત કર્યું હતું. આ જ ટેકનિક અન્ય કોઈ પણ વસ્તુ-વ્યક્તિ માટે ઉપયોગમાં લઈ શકાય અને સ્પષ્ટ, વાસ્તવિક લાગતી તસવીરો સર્જી શકાય. મેડિસિન અને માઈક્રોસ્કોપીથી માંડીને ખગોળવિજ્ઞાન અને ઉપગ્રહ દ્વારા લેવાયેલી તસવીરો સુધી તમામ ક્ષેત્રે આ સિસ્ટમનો ઉપયોગ કરી શકાય એમ હોવાનું સહ-લેખક સચિત મેનને જણાવ્યું હતું. 20 વર્ષના સચિતે તાજેતરમાં જ ડ્યુક યુનિવર્સિટીમાંથી મેથેમેટિક્સ અને કોમ્પ્યુટર સાયન્સમાં ડબલ મેજર સાથે ગ્રેજ્યુએશન પૂરું કર્યું છે.
સંશોધકોએ 14મી જૂનથી 19મી જૂન દરમ્યાન વર્ચ્યુઅલી યોજાયેલી 2020 કોન્ફરન્સ ઓન કોમ્પ્યુટર વિઝન એન્ડ પેટર્ન રેકગ્નિશન (સીવીપીઆર)માં પલ્સ નામે ઓળખાતી આ પદ્ધતિની રજૂઆત કરવાના છે. પરંપરાગત અભિગમો ઓછા રેઝોલ્યુશન ધરાવતી તસવીર માટે કલ્પનાનો સહારો લઈને એક્સ્ટ્રા પિક્સલ્સ મારફતે સરેરાશ કોમ્પ્યુટર મારફતે જોયેલી વધુ રેઝોલ્યુન ધરાવતી તસવીરોમાં અનુરૂપ પિક્સલ્સ સાથે મેળ બેસાડવાનો પ્રયાસ કરે છે. આ સરેરાશના પરિણામે, વાળ અને ત્વચાના ટેક્સ્ચરવાળા વિસ્તારો એક પિક્સલથી બીજા છેડે સુધી અસ્પ્ટ અને ધૂંધળા દેખાતા નથી. ઓછા રેઝોલ્યુશન ધરાવતી તસવીર લઈ અને પછી નવી ડિટેઇલ ઉમેરવાને બદલે આ સિસ્ટમ વધુ રેઝોલ્યુન ધરાવતાં ચહેરાઓના એઆઈ-જનરેટેડ ઉદાહરણોને ભૂંસી નાંખે છે અને એવાં ચહેરા શોધે છે, જે કદમાં સંકોચાય ત્યારે ઈનપુટ તસવીર જેવા દેખાતા ચહેરા શોધે છે.
સંશોધન ટીમે મશીન લર્નિંગમાં વપરાતા જનરેટિવ એડ્વર્સરિયલ નેટવર્ક અથવા જીએએન નામના ટૂલનો ઉપયોગ કર્યો હતો, જે ફોટોના એક જ ડેટા સેટ ઉપર પ્રશિક્ષિત બે ન્યુરલ નેટવર્ક છે. એક નેટવર્ક એઆઈ દ્વારા બનાવાયેલા માનવ ચહેરાઓ સાથે આવે છે, જે એ લોકોની નકલ કરે છે, જેના માટે તેને તાલીમ અપાઈ છે, જ્યારે બીજું નેટવર્ક આ આઉટપુટ મેળવે છે અને નક્કી કરે છે કે તે વાસ્તવિક ચીજ તરીકે થાપ આપવા માટે પૂરતી ખાતરી આપી શકે તેમ છે કે નહીં. જ્યાં સુધી બીજું નેટવર્ક શો તફાવત છે તે ન જણાવે ત્યાં સુધી પહેલું નેટવર્ક વધુને વધુ સારો અનુભવ અપાવે છે.
પલ્સ દ્વારા ઘોંઘાટભર્યા, નબળી ગુણવત્તા ધરાવતા ઈનપુટમાંથી પણ વાસ્તવિક લાગે તેવી તસવીરો સર્જી શકાય છે, જે અન્ય કોઈ પદ્ધતિઓમાં સંભવ નથી. રુડિને જણાવ્યું હતું કે એકમાત્ર ધૂંધળી તસવીરમાંથી પલ્સ દ્વારા અસ્વાભાવિક જીવનકાળની સંભાવનાઓની અસંખ્યગણી તસવીરો પેદા કરી શકે છે, જેમાંની પ્રત્યેક સૂક્ષ્મ રીતે એક અલગ વ્યક્તિ તરીકે દેખાય.
આંખો અને મોં ભાગ્યે જ ઓળખી શકાય તેટલા પિક્સલેટેડ ફોટોઝ હોય તો પણ અમારી અલ્ગોરિધમ તેમાંથી કંઈક સર્જન કરી શકે છે, જે પરંપરાગત અભિગમોમાં સંભવ ન હતું, એમ ડ્યુક યુનિવર્સિટીના સહ-લેખક એલેક્સ ડેમિયનનું કહેવું છે. 20 વર્ષીય એલેક્સનો મુખ્ય વિષય મેથેમેટિક્સ છે.
સિસ્ટમ 16x16 પિક્સલની ચહેરાની તસવીરને કેટલીક સેકન્ડ્સમાં જ 10 લાખ વધુ પિક્સલ્સ ઉમેરીને 1024 x 1024 પિક્સલ્સમાં ફેરવી શકે છે. ઓછા રેઝોલ્યુશન ધરાવતા ફોટોગ્રાફમાં દેખી ન શકાય તેવા એચડી વાળને કોમ્પ્યુટર-જનરેટેડ વર્ઝન્સમાં સ્પષ્ટ જોઈ શકાય છે.
સંશોધકોએ 40 લોકોને પલ્સ દ્વારા તૈયાર કરેલી 1440 તસવીરોને રેટિંગ આપવા કહ્યું હતું અને અન્ય પાંચ પદ્ધતિઓ માપદંડ માટે રજૂ કરી હતી. તેમાં પલ્સ શ્રેષ્ઠ સાબિત થઈ હતી અને તેને વાસ્તવિક વ્યક્તિની ઉચ્ચ ગુણવત્તા ધરાવતી તસવીર તરીકે સૌથી વધુ ગુણ મળ્યા હતા.