ETV Bharat / state

మీ మాటలకు అక్షరరూపం.. తెలుగులో తొలి ప్రయత్నం - ఐఐఐటీ హైదరాబాద్​ శ్రీకారం

మాటలకు అక్షరరూపం ఇచ్చే ప్రాజెక్టుకు ఐఐఐటీ హైదరాబాద్​ శ్రీకారం చుట్టింది. ప్రయోగాత్మకంగా తెలుగులో అమలు తర్వాత అన్ని భాషల్లో మాట్లాడే మాటలకు అమలు చేసేందుకు సిద్ధం అయ్యింది.

IIIT hyderabad underwent a major project The spelling of words
మహత్తర క్రతువు చేపట్టిన ఐఐఐటీ
author img

By

Published : Dec 18, 2020, 9:13 AM IST

ప్రయోగాత్మకంగా తెలుగులో అమలు, తర్వాత అన్ని భాషల్లో మాట్లాడే మాటలకు.. అంతే వేగంగా అక్షర రూపం ఇచ్చే క్రతువుకు హైదరాబాద్‌లోని ఇంటర్నేషనల్‌ ఇన్‌స్టిట్యూట్‌ ఆఫ్‌ ఇన్‌ఫర్మేషన్‌ టెక్నాలజీ(ఐఐఐటీ) శ్రీకారం చుట్టింది. కేంద్ర ఎలక్ట్రానిక్స్‌, సమాచార సాంకేతిక శాఖ, నీతి ఆయోగ్‌ ఆధ్వర్యంలో.. ‘క్రౌడ్‌ సోర్సింగ్‌ ఆఫ్‌ స్పీచ్‌ డాటా సెర్చ్‌’ పేరిట మాట్లాడే భాషను కృత్రిమ మేధ సాయంతో నేరుగా అక్షరాలు(టెక్స్ట్‌)గా మార్చనున్నారు. ఈ ప్రాజెక్టుకు ఐఐఐటీ ప్రొడక్ట్‌ ల్యాబ్‌ హెడ్‌ ప్రకాశ్‌ ఎల్లా, స్పీచ్‌ ప్రాసెసింగ్‌ ల్యాబ్‌ సహాయ ఆచార్యుడు అనిల్‌ ఉప్పాల సారథ్యం వహిస్తున్నారు. తొలుత తెలుగు భాషలో ప్రాజెక్టు చేపడుతుండగా, రెండో దశలో 15 భారతీయ భాషలకు దాన్ని విస్తరించాలని కేంద్ర ప్రభుత్వం భావిస్తోంది.

‘రెండు వేల గంటల’ ప్రసంగాల సేకరణ

సాధారణంగా సంభాషణను అక్షర రూపంలోకి మార్చేందుకు ఆటోమేటిక్‌ స్పీచ్‌ రికగ్నిషన్‌(ఏఎస్‌ఆర్‌) సాంకేతికతను వినియోగిస్తారు. ఇది భారతీయ భాషల్లో పెద్దగా అందుబాటులో లేదు. కొన్ని అప్లికేషన్లు ఉన్నా సామాన్యులు మాట్లాడే భాషను, యాసను అర్థం చేసుకోలేపోతున్నాయి. ఈ పరిస్థితుల దృష్ట్యా జన బాహుళ్యంలో ఉన్న భాషకు అక్షరరూపం ఇచ్చే సాంకేతికతను అభివృద్ధి చేయాల్సిన అవసరం ఉందని ఐఐఐటీ పాలకమండలి అధ్యక్షుడు, ప్రొఫెసర్‌ రాజ్‌రెడ్డి కేంద్ర ప్రభుత్వానికి ప్రతిపాదించారు. దీనికి కేంద్రం సుముఖత వ్యక్తం చేసింది. తొలుత ప్రయోగాత్మకంగా తెలుగు భాషను ఎంపిక చేసి, ప్రాజెక్టు మంజూరు చేయడంతోపాటు రూ.కోటి కేటాయించింది. ఇందులో భాగంగా వచ్చే ఏడాది అక్టోబరులోగా రెండు వేల గంటల ప్రసంగాన్ని (స్పీచ్‌ డాటా) సేకరించి అక్షర రూపంలోకి మార్చనున్నారు.

ఎలా చేస్తారంటే

ఈ ప్రాజెక్టు కోసం ట్రిపుల్‌ ఐటీ ప్రత్యేకంగా అప్లికేషన్‌ను రూపొందించింది. విద్యార్థులకు వక్తృత్వ పోటీలు నిర్వహించడం ద్వారా ప్రసంగాన్ని (స్పీచ్‌) సేకరించాలని నిర్ణయించింది. ‘తొలుత సంక్షిప్త సందేశం ద్వారా వెబ్‌ లింక్‌ పంపుతాం. అందులో విద్యార్థులు వివిధ అంశాలపై మాట్లాడతారు. సదరు సమాచారం రాగానే వ్యక్తుల గుర్తింపును (ఐడెంటిటీ) తొలగిస్తాం.

డాటా అభివృద్ధి

సదరు ప్రసంగాన్ని చిన్నచిన్న భాగాలుగా విభజించి అక్షర రూపంలోకి మారుస్తాం. అనంతరం లేఖకుల (ట్రాన్స్‌స్కైబర్స్‌) సాయంతో తప్పులను సరిచేస్తాం. తెలుగు భాషలో యాస ఎక్కువగా ఉంటుంది. ప్రాంతాల వారీగా మాట్లాడే తీరు మారుతుంటుంది. దీనికి తగ్గట్టుగా సాధారణ ప్రజలతోనూ మాట్లాడించి, దాని ఆధారంగా డాటాను అభివృద్ధి చేస్తాం’ అని ఈ ప్రాజెక్టులో పాలుపంచుకుంటున్న ఎల్లా ప్రకాశ్‌, ఆచార్య అనిల్‌ ఉప్పాల వెల్లడించారు. ఆ మాటలు లేదా ప్రసంగాల్లో ఆంగ్లం, సంఖ్యలు, ఊత పదాలు ఉంటాయని, ఇలా అన్నింటినీ గుర్తించి అక్షరరూపంలోకి మారుస్తామని తెలిపారు.

ఇదీ చూడండి : వర్చువల్‌గానే కొత్త ఎంపిక ప్రక్రియలు

ప్రయోగాత్మకంగా తెలుగులో అమలు, తర్వాత అన్ని భాషల్లో మాట్లాడే మాటలకు.. అంతే వేగంగా అక్షర రూపం ఇచ్చే క్రతువుకు హైదరాబాద్‌లోని ఇంటర్నేషనల్‌ ఇన్‌స్టిట్యూట్‌ ఆఫ్‌ ఇన్‌ఫర్మేషన్‌ టెక్నాలజీ(ఐఐఐటీ) శ్రీకారం చుట్టింది. కేంద్ర ఎలక్ట్రానిక్స్‌, సమాచార సాంకేతిక శాఖ, నీతి ఆయోగ్‌ ఆధ్వర్యంలో.. ‘క్రౌడ్‌ సోర్సింగ్‌ ఆఫ్‌ స్పీచ్‌ డాటా సెర్చ్‌’ పేరిట మాట్లాడే భాషను కృత్రిమ మేధ సాయంతో నేరుగా అక్షరాలు(టెక్స్ట్‌)గా మార్చనున్నారు. ఈ ప్రాజెక్టుకు ఐఐఐటీ ప్రొడక్ట్‌ ల్యాబ్‌ హెడ్‌ ప్రకాశ్‌ ఎల్లా, స్పీచ్‌ ప్రాసెసింగ్‌ ల్యాబ్‌ సహాయ ఆచార్యుడు అనిల్‌ ఉప్పాల సారథ్యం వహిస్తున్నారు. తొలుత తెలుగు భాషలో ప్రాజెక్టు చేపడుతుండగా, రెండో దశలో 15 భారతీయ భాషలకు దాన్ని విస్తరించాలని కేంద్ర ప్రభుత్వం భావిస్తోంది.

‘రెండు వేల గంటల’ ప్రసంగాల సేకరణ

సాధారణంగా సంభాషణను అక్షర రూపంలోకి మార్చేందుకు ఆటోమేటిక్‌ స్పీచ్‌ రికగ్నిషన్‌(ఏఎస్‌ఆర్‌) సాంకేతికతను వినియోగిస్తారు. ఇది భారతీయ భాషల్లో పెద్దగా అందుబాటులో లేదు. కొన్ని అప్లికేషన్లు ఉన్నా సామాన్యులు మాట్లాడే భాషను, యాసను అర్థం చేసుకోలేపోతున్నాయి. ఈ పరిస్థితుల దృష్ట్యా జన బాహుళ్యంలో ఉన్న భాషకు అక్షరరూపం ఇచ్చే సాంకేతికతను అభివృద్ధి చేయాల్సిన అవసరం ఉందని ఐఐఐటీ పాలకమండలి అధ్యక్షుడు, ప్రొఫెసర్‌ రాజ్‌రెడ్డి కేంద్ర ప్రభుత్వానికి ప్రతిపాదించారు. దీనికి కేంద్రం సుముఖత వ్యక్తం చేసింది. తొలుత ప్రయోగాత్మకంగా తెలుగు భాషను ఎంపిక చేసి, ప్రాజెక్టు మంజూరు చేయడంతోపాటు రూ.కోటి కేటాయించింది. ఇందులో భాగంగా వచ్చే ఏడాది అక్టోబరులోగా రెండు వేల గంటల ప్రసంగాన్ని (స్పీచ్‌ డాటా) సేకరించి అక్షర రూపంలోకి మార్చనున్నారు.

ఎలా చేస్తారంటే

ఈ ప్రాజెక్టు కోసం ట్రిపుల్‌ ఐటీ ప్రత్యేకంగా అప్లికేషన్‌ను రూపొందించింది. విద్యార్థులకు వక్తృత్వ పోటీలు నిర్వహించడం ద్వారా ప్రసంగాన్ని (స్పీచ్‌) సేకరించాలని నిర్ణయించింది. ‘తొలుత సంక్షిప్త సందేశం ద్వారా వెబ్‌ లింక్‌ పంపుతాం. అందులో విద్యార్థులు వివిధ అంశాలపై మాట్లాడతారు. సదరు సమాచారం రాగానే వ్యక్తుల గుర్తింపును (ఐడెంటిటీ) తొలగిస్తాం.

డాటా అభివృద్ధి

సదరు ప్రసంగాన్ని చిన్నచిన్న భాగాలుగా విభజించి అక్షర రూపంలోకి మారుస్తాం. అనంతరం లేఖకుల (ట్రాన్స్‌స్కైబర్స్‌) సాయంతో తప్పులను సరిచేస్తాం. తెలుగు భాషలో యాస ఎక్కువగా ఉంటుంది. ప్రాంతాల వారీగా మాట్లాడే తీరు మారుతుంటుంది. దీనికి తగ్గట్టుగా సాధారణ ప్రజలతోనూ మాట్లాడించి, దాని ఆధారంగా డాటాను అభివృద్ధి చేస్తాం’ అని ఈ ప్రాజెక్టులో పాలుపంచుకుంటున్న ఎల్లా ప్రకాశ్‌, ఆచార్య అనిల్‌ ఉప్పాల వెల్లడించారు. ఆ మాటలు లేదా ప్రసంగాల్లో ఆంగ్లం, సంఖ్యలు, ఊత పదాలు ఉంటాయని, ఇలా అన్నింటినీ గుర్తించి అక్షరరూపంలోకి మారుస్తామని తెలిపారు.

ఇదీ చూడండి : వర్చువల్‌గానే కొత్త ఎంపిక ప్రక్రియలు

ETV Bharat Logo

Copyright © 2025 Ushodaya Enterprises Pvt. Ltd., All Rights Reserved.