தமிழ்நாடு

tamil nadu

ETV Bharat / technology

தமிழ் AI மாடல் சர்வம் 1 அறிமுகம்; இந்திய மொழிகளுக்கு அங்கீகாரம்!

இந்திய மொழிகளில் செயற்கை நுண்ணறிவைப் பயன்படுத்தும் வகையில் ‘சர்வம் 1’ அறிமுகம் செய்யப்பட்டுள்ளது. இதில் தமிழ், மலையாளம், தெலுங்கு உள்ளிட்ட 10 மொழிகளில் ஆதரவு வழங்கப்பட்டுள்ளது.

Sarvam AI Launches Multilingual AI Model Sarvam 1 with tamil and nine more Indic Languages
’சர்வம் 1’ செயற்கை நுண்ணறிவு திறன் கொண்ட இந்திய மொழி மாதிரி அறிமுகம், (ETV Bharat Tamil Nadu)

By ETV Bharat Tech Team

Published : Oct 30, 2024, 10:22 AM IST

பெங்களூருவை தலைமை இடமாகக் கொண்ட சர்வம் ஏஐ, சர்வம்-1 என்ற புதிய பெரிய மொழி மாதிரியை (LLM) அறிமுகப்படுத்தியுள்ளது. தமிழ், மலையாளம், தெலுங்கு, கன்னடம், மராத்தி, இந்தி, பெங்காலி, குஜராத்தி, ஒரியா, பஞ்சாபி உள்ளிட்ட பத்து முக்கிய இந்திய மொழிகளை ஆங்கிலத்துடன் ஆதரிக்கும் வகையில் 2-பில்லியன் பேராமீட்டர் மாடல் வெளியிடப்பட்டுள்ளது.

தற்போது உள்நாட்டில் செயற்கை நுண்ணறிவு அடிப்படையிலான பெரிய மொழி மாதிரிகள் பெரிதளவில் இல்லை என்பது குறிப்பிடத்தக்கது. மக்கள் பெரும்பாலும் சாட்ஜிபிடி போன்ற (ChatGPT) ஆங்கிலம் சார்ந்த மொழி மாதிரிகளையே பயன்படுத்தி வருகின்றனர். இந்த சூழலில் பல இந்திய மொழிகளை சார்ந்து வந்திருக்கும் ‘சர்வம் 1’, உள்நாட்டு மக்களுக்கு தங்கள் தாய்மொழியில் AI பயன்பாட்டை எளிதாக அணுகக்கூடியதை உறுதிசெய்யும் என எதிர்பார்க்கப்படுகிறது.

சர்வம் 1 சிறப்புகள்:

டோக்கன் செயல்திறன் மற்றும் தரவுத் தரம் ஆகிய இரண்டு முக்கியமான பகுதிகள் மேம்படுத்தப்பட்டு ‘சர்வம் 1’ அறிமுகம் செய்யப்பட்டுள்ளது. முன்னதாக இருக்கும் AI மொழி மாதிரிகள், இந்திய மொழி வாக்கியத் தொகுப்புக்கு அதிக டோக்கன் தேவையை (ஒரு வார்த்தைக்கு தேவையான டோக்கன்களின் எண்ணிக்கை) வெளிப்படுத்துகின்றன.

ஆங்கிலத்திற்கு 1.4 உடன் ஒப்பிடும்போது ஒரு வார்த்தைக்கு 4-8 டோக்கன்கள் நம் உள்நாட்டு தாய்மொழிகளுக்குத் தேவைப்படுகின்றன. இதில் தான் சர்வம் 1 தன் மேம்பட்ட திறனை வெளிப்படுத்துகிறது. அதாவது ஆங்கிலத்திற்கு சற்றும் குறைவில்லாமல், 1.4 முதல் 2.1 டோக்கன்களால் இந்திய மொழி வாக்கியங்களை உருவாக்கலாம் என 'சர்வம் AI' தங்கள் பயன்பாடான, ‘சர்வம் 1’ வாயிலாக நிரூபித்துக் காட்டியுள்ளது.

இதையும் படிங்க
  1. வானில் பறந்தபடியே வீடியோ கால் பேசலாம்; கத்தார் ஏர்வேஸ் ஸ்டார்லிங்க் ஒப்பந்தம்!
  2. சமூக வலைத்தளங்களில் இளம் பெண்களை குறிவைத்து மோசடி செய்யும் கும்பல்!
  3. ஏஐ இல்லாத போன்களை மக்கள் விரும்பமாட்டார்கள் - கவுண்டர்பாயின்ட்

சர்வம் ஏஐ:

ஒரு பயனர் தங்களுக்குத் தேவையானத் தகவல்களை செயற்கை நுண்ணறிவு சார்ந்த பயன்பாட்டை அணுகும்போது, இணையம் மற்றும் செயற்கையாக உருவாக்கப்படும் தரவுகள் நியூரல் எஞ்சின்களால் செயல்படுத்தப்படும். அப்போது, ஆங்கிலம் அல்லாத உள்நாட்டு மொழிகளில் வாக்கிய அமைப்பு அவ்வளவு சரியானதாக இருப்பதில்லை.

அதாவது, ஒரு வார்த்தைக்கு பின் எந்த வார்த்தை வேண்டும் என்பதை செயற்கை நுண்ணறிவு சார்ந்த மொழி மாதிரிகள் சரியாகக் கணிக்கத் தவறுகின்றன. இந்த பிரச்சினையை, ‘சர்வம் 1’ போக்கும் என இதன் இணை நிறுவனரான பிரதியூஷ் குமார் தெரிவித்துள்ளார்.

ஈடிவி பாரத் தமிழ்நாடு (ETV Bharat Tamil Nadu)

ஈடிவி பாரத் தமிழ் வாட்ஸ்ஆப் சேனலில் இணையஇங்கே கிளிக் செய்யவும்.

தொழில்நுட்பம் சார்ந்த அண்மை செய்திகளுக்குஈடிவி பாரத் தமிழ்நாடு 'டெக்னாலஜி'பக்கத்துடன் இணைந்திருங்கள்.

ABOUT THE AUTHOR

...view details