ETV Bharat / bharat

આર્ટિફિશિયલ ઈન્ટેલિજન્સ વડે તસવીરના ધૂંંધળા ચહેરાને 60 ગણો સ્પષ્ટ બનાવી શકાશે: ડ્યુક યુનિવર્સિટીનુંં સંંશોધન

આર્ટિફિશિયલ ઈન્ટેલિજન્સ (એઆઈ)ની મદદથી હાઈ-ડેફિનિશન (એચડી)માં ધૂંધળામાં ધૂંધળી તસવીરને પણ વાસ્તવિક કોમ્યુટર-જનરેટેડ ચહેરામાં ફેરવી શકાય છે. ડ્યુક યુનિવર્સિટીના સંશોધકોએ એવું એઆઈ ટૂલ વિકસાવ્યું છે, જે લોકોના ચહેરા ઓળખી ન શકાય એટલી ધૂંધળી તસવીરને અગાઉ કરતાં વધુ સ્પષ્ટ અને સહેલાઈથી ઓળખી શકાય તેવા કોમ્પ્યુટર-જનરેટેડ પોર્ટ્રેઇટ્સમાં ફેરવી શકાય છે.

આર્ટિફિશિયલ ઈન્ટેલિજન્સ વડે તસવીરના ધૂંંધળા ચહેરાને 60 ગણો સ્પષ્ટ બનાવી શકાશે: ડ્યુક યુનિવર્સિટીનુંં સંંશોધન
આર્ટિફિશિયલ ઈન્ટેલિજન્સ વડે તસવીરના ધૂંંધળા ચહેરાને 60 ગણો સ્પષ્ટ બનાવી શકાશે: ડ્યુક યુનિવર્સિટીનુંં સંંશોધન
author img

By

Published : Jun 17, 2020, 4:31 AM IST

ડરહમ (નોર્થ કેલિફોર્નિયા): અગાઉની પદ્ધતિઓમાં તસવીરને તેના મૂળ રેઝોલ્યુશન કરતાં આઠ ગણો વધુ સ્પષ્ટ બનાવી શકાતો હતો. પરંતુ ડ્યુક યુનિવર્સિટીની ટીમે કેટલાક પિક્સલ્સની મદદથી મૂળ રેઝોલ્યુશન કરતાં 64 ગણો વધુ સ્પષ્ટ, વાસ્તવિક લાગે તેવો ચહેરો બનાવતું ટૂલ વિકસાવ્યું છે. ઈમેજિંનિંગના આ ટૂલમાં ફાઈન લાઈન્સ, આઈલેશીઝ અને સ્ટબલ જેવાં ફીચર્સ છે, જે અગાઉ ક્યારેય ઉપયોગમાં લેવાયા ન હતાં.

સંશોધન ટીમનું નેતૃત્ત્વ કરી રહેલા ડ્યુક યુનિવર્સિટીના કોમ્પ્યુટર સાયન્ટિસ્ટ સિન્થિયા રુડિને જણાવ્યું કે આટલી બારીકાઈપૂર્વક અગાઉ ક્યારેય કોઈ આટલી હદે ધૂંધળી તસવીરને આટલી બધી સ્પષ્ટ બનાવી શકાઈ નથી.

સંશોધકો કહે છે કે સિસ્ટમનો ઉપયોગ લોકોના ચહેરા ઓળખી શકાતો નથી. તેનાથી સિક્યોરિટી કેમેરામાંથી ધૂંધળા દેખાતા ફોટોગ્રાફને તદ્દન સ્પષ્ટ સાચા માણસના ફોટોગ્રાફમાં પરિવર્તિત કરી શકાતો નથી. તેના બદલે આ સિસ્ટમ નવા ચહેરાઓ પેદા કરવામાં સક્ષમ છે, જે અસ્તિત્ત્વ જ ધરાવતા ન હોય, પરંતુ બુદ્ધિગમ્ય રીતે તે વાસ્તવિક લાગે.

સંશોધકોએ અભિગમના પુરાવા તરીકે ચહેરા ઉપર ધ્યાન કેન્દ્રિત કર્યું હતું. આ જ ટેકનિક અન્ય કોઈ પણ વસ્તુ-વ્યક્તિ માટે ઉપયોગમાં લઈ શકાય અને સ્પષ્ટ, વાસ્તવિક લાગતી તસવીરો સર્જી શકાય. મેડિસિન અને માઈક્રોસ્કોપીથી માંડીને ખગોળવિજ્ઞાન અને ઉપગ્રહ દ્વારા લેવાયેલી તસવીરો સુધી તમામ ક્ષેત્રે આ સિસ્ટમનો ઉપયોગ કરી શકાય એમ હોવાનું સહ-લેખક સચિત મેનને જણાવ્યું હતું. 20 વર્ષના સચિતે તાજેતરમાં જ ડ્યુક યુનિવર્સિટીમાંથી મેથેમેટિક્સ અને કોમ્પ્યુટર સાયન્સમાં ડબલ મેજર સાથે ગ્રેજ્યુએશન પૂરું કર્યું છે.

સંશોધકોએ 14મી જૂનથી 19મી જૂન દરમ્યાન વર્ચ્યુઅલી યોજાયેલી 2020 કોન્ફરન્સ ઓન કોમ્પ્યુટર વિઝન એન્ડ પેટર્ન રેકગ્નિશન (સીવીપીઆર)માં પલ્સ નામે ઓળખાતી આ પદ્ધતિની રજૂઆત કરવાના છે. પરંપરાગત અભિગમો ઓછા રેઝોલ્યુશન ધરાવતી તસવીર માટે કલ્પનાનો સહારો લઈને એક્સ્ટ્રા પિક્સલ્સ મારફતે સરેરાશ કોમ્પ્યુટર મારફતે જોયેલી વધુ રેઝોલ્યુન ધરાવતી તસવીરોમાં અનુરૂપ પિક્સલ્સ સાથે મેળ બેસાડવાનો પ્રયાસ કરે છે. આ સરેરાશના પરિણામે, વાળ અને ત્વચાના ટેક્સ્ચરવાળા વિસ્તારો એક પિક્સલથી બીજા છેડે સુધી અસ્પ્ટ અને ધૂંધળા દેખાતા નથી. ઓછા રેઝોલ્યુશન ધરાવતી તસવીર લઈ અને પછી નવી ડિટેઇલ ઉમેરવાને બદલે આ સિસ્ટમ વધુ રેઝોલ્યુન ધરાવતાં ચહેરાઓના એઆઈ-જનરેટેડ ઉદાહરણોને ભૂંસી નાંખે છે અને એવાં ચહેરા શોધે છે, જે કદમાં સંકોચાય ત્યારે ઈનપુટ તસવીર જેવા દેખાતા ચહેરા શોધે છે.

સંશોધન ટીમે મશીન લર્નિંગમાં વપરાતા જનરેટિવ એડ્વર્સરિયલ નેટવર્ક અથવા જીએએન નામના ટૂલનો ઉપયોગ કર્યો હતો, જે ફોટોના એક જ ડેટા સેટ ઉપર પ્રશિક્ષિત બે ન્યુરલ નેટવર્ક છે. એક નેટવર્ક એઆઈ દ્વારા બનાવાયેલા માનવ ચહેરાઓ સાથે આવે છે, જે એ લોકોની નકલ કરે છે, જેના માટે તેને તાલીમ અપાઈ છે, જ્યારે બીજું નેટવર્ક આ આઉટપુટ મેળવે છે અને નક્કી કરે છે કે તે વાસ્તવિક ચીજ તરીકે થાપ આપવા માટે પૂરતી ખાતરી આપી શકે તેમ છે કે નહીં. જ્યાં સુધી બીજું નેટવર્ક શો તફાવત છે તે ન જણાવે ત્યાં સુધી પહેલું નેટવર્ક વધુને વધુ સારો અનુભવ અપાવે છે.

પલ્સ દ્વારા ઘોંઘાટભર્યા, નબળી ગુણવત્તા ધરાવતા ઈનપુટમાંથી પણ વાસ્તવિક લાગે તેવી તસવીરો સર્જી શકાય છે, જે અન્ય કોઈ પદ્ધતિઓમાં સંભવ નથી. રુડિને જણાવ્યું હતું કે એકમાત્ર ધૂંધળી તસવીરમાંથી પલ્સ દ્વારા અસ્વાભાવિક જીવનકાળની સંભાવનાઓની અસંખ્યગણી તસવીરો પેદા કરી શકે છે, જેમાંની પ્રત્યેક સૂક્ષ્મ રીતે એક અલગ વ્યક્તિ તરીકે દેખાય.

આંખો અને મોં ભાગ્યે જ ઓળખી શકાય તેટલા પિક્સલેટેડ ફોટોઝ હોય તો પણ અમારી અલ્ગોરિધમ તેમાંથી કંઈક સર્જન કરી શકે છે, જે પરંપરાગત અભિગમોમાં સંભવ ન હતું, એમ ડ્યુક યુનિવર્સિટીના સહ-લેખક એલેક્સ ડેમિયનનું કહેવું છે. 20 વર્ષીય એલેક્સનો મુખ્ય વિષય મેથેમેટિક્સ છે.

સિસ્ટમ 16x16 પિક્સલની ચહેરાની તસવીરને કેટલીક સેકન્ડ્સમાં જ 10 લાખ વધુ પિક્સલ્સ ઉમેરીને 1024 x 1024 પિક્સલ્સમાં ફેરવી શકે છે. ઓછા રેઝોલ્યુશન ધરાવતા ફોટોગ્રાફમાં દેખી ન શકાય તેવા એચડી વાળને કોમ્પ્યુટર-જનરેટેડ વર્ઝન્સમાં સ્પષ્ટ જોઈ શકાય છે.

સંશોધકોએ 40 લોકોને પલ્સ દ્વારા તૈયાર કરેલી 1440 તસવીરોને રેટિંગ આપવા કહ્યું હતું અને અન્ય પાંચ પદ્ધતિઓ માપદંડ માટે રજૂ કરી હતી. તેમાં પલ્સ શ્રેષ્ઠ સાબિત થઈ હતી અને તેને વાસ્તવિક વ્યક્તિની ઉચ્ચ ગુણવત્તા ધરાવતી તસવીર તરીકે સૌથી વધુ ગુણ મળ્યા હતા.

ડરહમ (નોર્થ કેલિફોર્નિયા): અગાઉની પદ્ધતિઓમાં તસવીરને તેના મૂળ રેઝોલ્યુશન કરતાં આઠ ગણો વધુ સ્પષ્ટ બનાવી શકાતો હતો. પરંતુ ડ્યુક યુનિવર્સિટીની ટીમે કેટલાક પિક્સલ્સની મદદથી મૂળ રેઝોલ્યુશન કરતાં 64 ગણો વધુ સ્પષ્ટ, વાસ્તવિક લાગે તેવો ચહેરો બનાવતું ટૂલ વિકસાવ્યું છે. ઈમેજિંનિંગના આ ટૂલમાં ફાઈન લાઈન્સ, આઈલેશીઝ અને સ્ટબલ જેવાં ફીચર્સ છે, જે અગાઉ ક્યારેય ઉપયોગમાં લેવાયા ન હતાં.

સંશોધન ટીમનું નેતૃત્ત્વ કરી રહેલા ડ્યુક યુનિવર્સિટીના કોમ્પ્યુટર સાયન્ટિસ્ટ સિન્થિયા રુડિને જણાવ્યું કે આટલી બારીકાઈપૂર્વક અગાઉ ક્યારેય કોઈ આટલી હદે ધૂંધળી તસવીરને આટલી બધી સ્પષ્ટ બનાવી શકાઈ નથી.

સંશોધકો કહે છે કે સિસ્ટમનો ઉપયોગ લોકોના ચહેરા ઓળખી શકાતો નથી. તેનાથી સિક્યોરિટી કેમેરામાંથી ધૂંધળા દેખાતા ફોટોગ્રાફને તદ્દન સ્પષ્ટ સાચા માણસના ફોટોગ્રાફમાં પરિવર્તિત કરી શકાતો નથી. તેના બદલે આ સિસ્ટમ નવા ચહેરાઓ પેદા કરવામાં સક્ષમ છે, જે અસ્તિત્ત્વ જ ધરાવતા ન હોય, પરંતુ બુદ્ધિગમ્ય રીતે તે વાસ્તવિક લાગે.

સંશોધકોએ અભિગમના પુરાવા તરીકે ચહેરા ઉપર ધ્યાન કેન્દ્રિત કર્યું હતું. આ જ ટેકનિક અન્ય કોઈ પણ વસ્તુ-વ્યક્તિ માટે ઉપયોગમાં લઈ શકાય અને સ્પષ્ટ, વાસ્તવિક લાગતી તસવીરો સર્જી શકાય. મેડિસિન અને માઈક્રોસ્કોપીથી માંડીને ખગોળવિજ્ઞાન અને ઉપગ્રહ દ્વારા લેવાયેલી તસવીરો સુધી તમામ ક્ષેત્રે આ સિસ્ટમનો ઉપયોગ કરી શકાય એમ હોવાનું સહ-લેખક સચિત મેનને જણાવ્યું હતું. 20 વર્ષના સચિતે તાજેતરમાં જ ડ્યુક યુનિવર્સિટીમાંથી મેથેમેટિક્સ અને કોમ્પ્યુટર સાયન્સમાં ડબલ મેજર સાથે ગ્રેજ્યુએશન પૂરું કર્યું છે.

સંશોધકોએ 14મી જૂનથી 19મી જૂન દરમ્યાન વર્ચ્યુઅલી યોજાયેલી 2020 કોન્ફરન્સ ઓન કોમ્પ્યુટર વિઝન એન્ડ પેટર્ન રેકગ્નિશન (સીવીપીઆર)માં પલ્સ નામે ઓળખાતી આ પદ્ધતિની રજૂઆત કરવાના છે. પરંપરાગત અભિગમો ઓછા રેઝોલ્યુશન ધરાવતી તસવીર માટે કલ્પનાનો સહારો લઈને એક્સ્ટ્રા પિક્સલ્સ મારફતે સરેરાશ કોમ્પ્યુટર મારફતે જોયેલી વધુ રેઝોલ્યુન ધરાવતી તસવીરોમાં અનુરૂપ પિક્સલ્સ સાથે મેળ બેસાડવાનો પ્રયાસ કરે છે. આ સરેરાશના પરિણામે, વાળ અને ત્વચાના ટેક્સ્ચરવાળા વિસ્તારો એક પિક્સલથી બીજા છેડે સુધી અસ્પ્ટ અને ધૂંધળા દેખાતા નથી. ઓછા રેઝોલ્યુશન ધરાવતી તસવીર લઈ અને પછી નવી ડિટેઇલ ઉમેરવાને બદલે આ સિસ્ટમ વધુ રેઝોલ્યુન ધરાવતાં ચહેરાઓના એઆઈ-જનરેટેડ ઉદાહરણોને ભૂંસી નાંખે છે અને એવાં ચહેરા શોધે છે, જે કદમાં સંકોચાય ત્યારે ઈનપુટ તસવીર જેવા દેખાતા ચહેરા શોધે છે.

સંશોધન ટીમે મશીન લર્નિંગમાં વપરાતા જનરેટિવ એડ્વર્સરિયલ નેટવર્ક અથવા જીએએન નામના ટૂલનો ઉપયોગ કર્યો હતો, જે ફોટોના એક જ ડેટા સેટ ઉપર પ્રશિક્ષિત બે ન્યુરલ નેટવર્ક છે. એક નેટવર્ક એઆઈ દ્વારા બનાવાયેલા માનવ ચહેરાઓ સાથે આવે છે, જે એ લોકોની નકલ કરે છે, જેના માટે તેને તાલીમ અપાઈ છે, જ્યારે બીજું નેટવર્ક આ આઉટપુટ મેળવે છે અને નક્કી કરે છે કે તે વાસ્તવિક ચીજ તરીકે થાપ આપવા માટે પૂરતી ખાતરી આપી શકે તેમ છે કે નહીં. જ્યાં સુધી બીજું નેટવર્ક શો તફાવત છે તે ન જણાવે ત્યાં સુધી પહેલું નેટવર્ક વધુને વધુ સારો અનુભવ અપાવે છે.

પલ્સ દ્વારા ઘોંઘાટભર્યા, નબળી ગુણવત્તા ધરાવતા ઈનપુટમાંથી પણ વાસ્તવિક લાગે તેવી તસવીરો સર્જી શકાય છે, જે અન્ય કોઈ પદ્ધતિઓમાં સંભવ નથી. રુડિને જણાવ્યું હતું કે એકમાત્ર ધૂંધળી તસવીરમાંથી પલ્સ દ્વારા અસ્વાભાવિક જીવનકાળની સંભાવનાઓની અસંખ્યગણી તસવીરો પેદા કરી શકે છે, જેમાંની પ્રત્યેક સૂક્ષ્મ રીતે એક અલગ વ્યક્તિ તરીકે દેખાય.

આંખો અને મોં ભાગ્યે જ ઓળખી શકાય તેટલા પિક્સલેટેડ ફોટોઝ હોય તો પણ અમારી અલ્ગોરિધમ તેમાંથી કંઈક સર્જન કરી શકે છે, જે પરંપરાગત અભિગમોમાં સંભવ ન હતું, એમ ડ્યુક યુનિવર્સિટીના સહ-લેખક એલેક્સ ડેમિયનનું કહેવું છે. 20 વર્ષીય એલેક્સનો મુખ્ય વિષય મેથેમેટિક્સ છે.

સિસ્ટમ 16x16 પિક્સલની ચહેરાની તસવીરને કેટલીક સેકન્ડ્સમાં જ 10 લાખ વધુ પિક્સલ્સ ઉમેરીને 1024 x 1024 પિક્સલ્સમાં ફેરવી શકે છે. ઓછા રેઝોલ્યુશન ધરાવતા ફોટોગ્રાફમાં દેખી ન શકાય તેવા એચડી વાળને કોમ્પ્યુટર-જનરેટેડ વર્ઝન્સમાં સ્પષ્ટ જોઈ શકાય છે.

સંશોધકોએ 40 લોકોને પલ્સ દ્વારા તૈયાર કરેલી 1440 તસવીરોને રેટિંગ આપવા કહ્યું હતું અને અન્ય પાંચ પદ્ધતિઓ માપદંડ માટે રજૂ કરી હતી. તેમાં પલ્સ શ્રેષ્ઠ સાબિત થઈ હતી અને તેને વાસ્તવિક વ્યક્તિની ઉચ્ચ ગુણવત્તા ધરાવતી તસવીર તરીકે સૌથી વધુ ગુણ મળ્યા હતા.

ETV Bharat Logo

Copyright © 2024 Ushodaya Enterprises Pvt. Ltd., All Rights Reserved.