தமிழ்நாடு

tamil nadu

ETV Bharat / technology

தமிழ் AI மாடல் சர்வம் 1 அறிமுகம்; இந்திய மொழிகளுக்கு அங்கீகாரம்!

இந்திய மொழிகளில் செயற்கை நுண்ணறிவைப் பயன்படுத்தும் வகையில் ‘சர்வம் 1’ அறிமுகம் செய்யப்பட்டுள்ளது. இதில் தமிழ், மலையாளம், தெலுங்கு உள்ளிட்ட 10 மொழிகளில் ஆதரவு வழங்கப்பட்டுள்ளது.

Sarvam AI Launches Multilingual AI Model Sarvam 1 with tamil and nine more Indic Languages
’சர்வம் 1’ செயற்கை நுண்ணறிவு திறன் கொண்ட இந்திய மொழி மாதிரி அறிமுகம், (ETV Bharat Tamil Nadu)

By ETV Bharat Tech Team

Published : 4 hours ago

பெங்களூருவை தலைமை இடமாகக் கொண்ட சர்வம் ஏஐ, சர்வம்-1 என்ற புதிய பெரிய மொழி மாதிரியை (LLM) அறிமுகப்படுத்தியுள்ளது. தமிழ், மலையாளம், தெலுங்கு, கன்னடம், மராத்தி, இந்தி, பெங்காலி, குஜராத்தி, ஒரியா, பஞ்சாபி உள்ளிட்ட பத்து முக்கிய இந்திய மொழிகளை ஆங்கிலத்துடன் ஆதரிக்கும் வகையில் 2-பில்லியன் பேராமீட்டர் மாடல் வெளியிடப்பட்டுள்ளது.

தற்போது உள்நாட்டில் செயற்கை நுண்ணறிவு அடிப்படையிலான பெரிய மொழி மாதிரிகள் பெரிதளவில் இல்லை என்பது குறிப்பிடத்தக்கது. மக்கள் பெரும்பாலும் சாட்ஜிபிடி போன்ற (ChatGPT) ஆங்கிலம் சார்ந்த மொழி மாதிரிகளையே பயன்படுத்தி வருகின்றனர். இந்த சூழலில் பல இந்திய மொழிகளை சார்ந்து வந்திருக்கும் ‘சர்வம் 1’, உள்நாட்டு மக்களுக்கு தங்கள் தாய்மொழியில் AI பயன்பாட்டை எளிதாக அணுகக்கூடியதை உறுதிசெய்யும் என எதிர்பார்க்கப்படுகிறது.

சர்வம் 1 சிறப்புகள்:

டோக்கன் செயல்திறன் மற்றும் தரவுத் தரம் ஆகிய இரண்டு முக்கியமான பகுதிகள் மேம்படுத்தப்பட்டு ‘சர்வம் 1’ அறிமுகம் செய்யப்பட்டுள்ளது. முன்னதாக இருக்கும் AI மொழி மாதிரிகள், இந்திய மொழி வாக்கியத் தொகுப்புக்கு அதிக டோக்கன் தேவையை (ஒரு வார்த்தைக்கு தேவையான டோக்கன்களின் எண்ணிக்கை) வெளிப்படுத்துகின்றன.

ஆங்கிலத்திற்கு 1.4 உடன் ஒப்பிடும்போது ஒரு வார்த்தைக்கு 4-8 டோக்கன்கள் நம் உள்நாட்டு தாய்மொழிகளுக்குத் தேவைப்படுகின்றன. இதில் தான் சர்வம் 1 தன் மேம்பட்ட திறனை வெளிப்படுத்துகிறது. அதாவது ஆங்கிலத்திற்கு சற்றும் குறைவில்லாமல், 1.4 முதல் 2.1 டோக்கன்களால் இந்திய மொழி வாக்கியங்களை உருவாக்கலாம் என 'சர்வம் AI' தங்கள் பயன்பாடான, ‘சர்வம் 1’ வாயிலாக நிரூபித்துக் காட்டியுள்ளது.

இதையும் படிங்க
  1. வானில் பறந்தபடியே வீடியோ கால் பேசலாம்; கத்தார் ஏர்வேஸ் ஸ்டார்லிங்க் ஒப்பந்தம்!
  2. சமூக வலைத்தளங்களில் இளம் பெண்களை குறிவைத்து மோசடி செய்யும் கும்பல்!
  3. ஏஐ இல்லாத போன்களை மக்கள் விரும்பமாட்டார்கள் - கவுண்டர்பாயின்ட்

சர்வம் ஏஐ:

ஒரு பயனர் தங்களுக்குத் தேவையானத் தகவல்களை செயற்கை நுண்ணறிவு சார்ந்த பயன்பாட்டை அணுகும்போது, இணையம் மற்றும் செயற்கையாக உருவாக்கப்படும் தரவுகள் நியூரல் எஞ்சின்களால் செயல்படுத்தப்படும். அப்போது, ஆங்கிலம் அல்லாத உள்நாட்டு மொழிகளில் வாக்கிய அமைப்பு அவ்வளவு சரியானதாக இருப்பதில்லை.

அதாவது, ஒரு வார்த்தைக்கு பின் எந்த வார்த்தை வேண்டும் என்பதை செயற்கை நுண்ணறிவு சார்ந்த மொழி மாதிரிகள் சரியாகக் கணிக்கத் தவறுகின்றன. இந்த பிரச்சினையை, ‘சர்வம் 1’ போக்கும் என இதன் இணை நிறுவனரான பிரதியூஷ் குமார் தெரிவித்துள்ளார்.

ஈடிவி பாரத் தமிழ்நாடு (ETV Bharat Tamil Nadu)

ஈடிவி பாரத் தமிழ் வாட்ஸ்ஆப் சேனலில் இணையஇங்கே கிளிக் செய்யவும்.

தொழில்நுட்பம் சார்ந்த அண்மை செய்திகளுக்குஈடிவி பாரத் தமிழ்நாடு 'டெக்னாலஜி'பக்கத்துடன் இணைந்திருங்கள்.

ABOUT THE AUTHOR

...view details