பெங்களூருவை தலைமை இடமாகக் கொண்ட சர்வம் ஏஐ, சர்வம்-1 என்ற புதிய பெரிய மொழி மாதிரியை (LLM) அறிமுகப்படுத்தியுள்ளது. தமிழ், மலையாளம், தெலுங்கு, கன்னடம், மராத்தி, இந்தி, பெங்காலி, குஜராத்தி, ஒரியா, பஞ்சாபி உள்ளிட்ட பத்து முக்கிய இந்திய மொழிகளை ஆங்கிலத்துடன் ஆதரிக்கும் வகையில் 2-பில்லியன் பேராமீட்டர் மாடல் வெளியிடப்பட்டுள்ளது.
தற்போது உள்நாட்டில் செயற்கை நுண்ணறிவு அடிப்படையிலான பெரிய மொழி மாதிரிகள் பெரிதளவில் இல்லை என்பது குறிப்பிடத்தக்கது. மக்கள் பெரும்பாலும் சாட்ஜிபிடி போன்ற (ChatGPT) ஆங்கிலம் சார்ந்த மொழி மாதிரிகளையே பயன்படுத்தி வருகின்றனர். இந்த சூழலில் பல இந்திய மொழிகளை சார்ந்து வந்திருக்கும் ‘சர்வம் 1’, உள்நாட்டு மக்களுக்கு தங்கள் தாய்மொழியில் AI பயன்பாட்டை எளிதாக அணுகக்கூடியதை உறுதிசெய்யும் என எதிர்பார்க்கப்படுகிறது.
சர்வம் 1 சிறப்புகள்:
டோக்கன் செயல்திறன் மற்றும் தரவுத் தரம் ஆகிய இரண்டு முக்கியமான பகுதிகள் மேம்படுத்தப்பட்டு ‘சர்வம் 1’ அறிமுகம் செய்யப்பட்டுள்ளது. முன்னதாக இருக்கும் AI மொழி மாதிரிகள், இந்திய மொழி வாக்கியத் தொகுப்புக்கு அதிக டோக்கன் தேவையை (ஒரு வார்த்தைக்கு தேவையான டோக்கன்களின் எண்ணிக்கை) வெளிப்படுத்துகின்றன.
ஆங்கிலத்திற்கு 1.4 உடன் ஒப்பிடும்போது ஒரு வார்த்தைக்கு 4-8 டோக்கன்கள் நம் உள்நாட்டு தாய்மொழிகளுக்குத் தேவைப்படுகின்றன. இதில் தான் சர்வம் 1 தன் மேம்பட்ட திறனை வெளிப்படுத்துகிறது. அதாவது ஆங்கிலத்திற்கு சற்றும் குறைவில்லாமல், 1.4 முதல் 2.1 டோக்கன்களால் இந்திய மொழி வாக்கியங்களை உருவாக்கலாம் என 'சர்வம் AI' தங்கள் பயன்பாடான, ‘சர்வம் 1’ வாயிலாக நிரூபித்துக் காட்டியுள்ளது.