ETV Bharat / technology

தமிழ் AI மாடல் சர்வம் 1 அறிமுகம்; இந்திய மொழிகளுக்கு அங்கீகாரம்!

இந்திய மொழிகளில் செயற்கை நுண்ணறிவைப் பயன்படுத்தும் வகையில் ‘சர்வம் 1’ அறிமுகம் செய்யப்பட்டுள்ளது. இதில் தமிழ், மலையாளம், தெலுங்கு உள்ளிட்ட 10 மொழிகளில் ஆதரவு வழங்கப்பட்டுள்ளது.

Sarvam AI Launches Multilingual AI Model Sarvam 1 with tamil and nine more Indic Languages
’சர்வம் 1’ செயற்கை நுண்ணறிவு திறன் கொண்ட இந்திய மொழி மாதிரி அறிமுகம், (ETV Bharat Tamil Nadu)
author img

By ETV Bharat Tech Team

Published : Oct 30, 2024, 10:22 AM IST

பெங்களூருவை தலைமை இடமாகக் கொண்ட சர்வம் ஏஐ, சர்வம்-1 என்ற புதிய பெரிய மொழி மாதிரியை (LLM) அறிமுகப்படுத்தியுள்ளது. தமிழ், மலையாளம், தெலுங்கு, கன்னடம், மராத்தி, இந்தி, பெங்காலி, குஜராத்தி, ஒரியா, பஞ்சாபி உள்ளிட்ட பத்து முக்கிய இந்திய மொழிகளை ஆங்கிலத்துடன் ஆதரிக்கும் வகையில் 2-பில்லியன் பேராமீட்டர் மாடல் வெளியிடப்பட்டுள்ளது.

தற்போது உள்நாட்டில் செயற்கை நுண்ணறிவு அடிப்படையிலான பெரிய மொழி மாதிரிகள் பெரிதளவில் இல்லை என்பது குறிப்பிடத்தக்கது. மக்கள் பெரும்பாலும் சாட்ஜிபிடி போன்ற (ChatGPT) ஆங்கிலம் சார்ந்த மொழி மாதிரிகளையே பயன்படுத்தி வருகின்றனர். இந்த சூழலில் பல இந்திய மொழிகளை சார்ந்து வந்திருக்கும் ‘சர்வம் 1’, உள்நாட்டு மக்களுக்கு தங்கள் தாய்மொழியில் AI பயன்பாட்டை எளிதாக அணுகக்கூடியதை உறுதிசெய்யும் என எதிர்பார்க்கப்படுகிறது.

சர்வம் 1 சிறப்புகள்:

டோக்கன் செயல்திறன் மற்றும் தரவுத் தரம் ஆகிய இரண்டு முக்கியமான பகுதிகள் மேம்படுத்தப்பட்டு ‘சர்வம் 1’ அறிமுகம் செய்யப்பட்டுள்ளது. முன்னதாக இருக்கும் AI மொழி மாதிரிகள், இந்திய மொழி வாக்கியத் தொகுப்புக்கு அதிக டோக்கன் தேவையை (ஒரு வார்த்தைக்கு தேவையான டோக்கன்களின் எண்ணிக்கை) வெளிப்படுத்துகின்றன.

ஆங்கிலத்திற்கு 1.4 உடன் ஒப்பிடும்போது ஒரு வார்த்தைக்கு 4-8 டோக்கன்கள் நம் உள்நாட்டு தாய்மொழிகளுக்குத் தேவைப்படுகின்றன. இதில் தான் சர்வம் 1 தன் மேம்பட்ட திறனை வெளிப்படுத்துகிறது. அதாவது ஆங்கிலத்திற்கு சற்றும் குறைவில்லாமல், 1.4 முதல் 2.1 டோக்கன்களால் இந்திய மொழி வாக்கியங்களை உருவாக்கலாம் என 'சர்வம் AI' தங்கள் பயன்பாடான, ‘சர்வம் 1’ வாயிலாக நிரூபித்துக் காட்டியுள்ளது.

இதையும் படிங்க
  1. வானில் பறந்தபடியே வீடியோ கால் பேசலாம்; கத்தார் ஏர்வேஸ் ஸ்டார்லிங்க் ஒப்பந்தம்!
  2. சமூக வலைத்தளங்களில் இளம் பெண்களை குறிவைத்து மோசடி செய்யும் கும்பல்!
  3. ஏஐ இல்லாத போன்களை மக்கள் விரும்பமாட்டார்கள் - கவுண்டர்பாயின்ட்

சர்வம் ஏஐ:

ஒரு பயனர் தங்களுக்குத் தேவையானத் தகவல்களை செயற்கை நுண்ணறிவு சார்ந்த பயன்பாட்டை அணுகும்போது, இணையம் மற்றும் செயற்கையாக உருவாக்கப்படும் தரவுகள் நியூரல் எஞ்சின்களால் செயல்படுத்தப்படும். அப்போது, ஆங்கிலம் அல்லாத உள்நாட்டு மொழிகளில் வாக்கிய அமைப்பு அவ்வளவு சரியானதாக இருப்பதில்லை.

அதாவது, ஒரு வார்த்தைக்கு பின் எந்த வார்த்தை வேண்டும் என்பதை செயற்கை நுண்ணறிவு சார்ந்த மொழி மாதிரிகள் சரியாகக் கணிக்கத் தவறுகின்றன. இந்த பிரச்சினையை, ‘சர்வம் 1’ போக்கும் என இதன் இணை நிறுவனரான பிரதியூஷ் குமார் தெரிவித்துள்ளார்.

etv bharat tamil nadu whatsapp channel link and QR Code
ஈடிவி பாரத் தமிழ்நாடு (ETV Bharat Tamil Nadu)

ஈடிவி பாரத் தமிழ் வாட்ஸ்ஆப் சேனலில் இணைய இங்கே கிளிக் செய்யவும்.

தொழில்நுட்பம் சார்ந்த அண்மை செய்திகளுக்கு ஈடிவி பாரத் தமிழ்நாடு 'டெக்னாலஜி' பக்கத்துடன் இணைந்திருங்கள்.

பெங்களூருவை தலைமை இடமாகக் கொண்ட சர்வம் ஏஐ, சர்வம்-1 என்ற புதிய பெரிய மொழி மாதிரியை (LLM) அறிமுகப்படுத்தியுள்ளது. தமிழ், மலையாளம், தெலுங்கு, கன்னடம், மராத்தி, இந்தி, பெங்காலி, குஜராத்தி, ஒரியா, பஞ்சாபி உள்ளிட்ட பத்து முக்கிய இந்திய மொழிகளை ஆங்கிலத்துடன் ஆதரிக்கும் வகையில் 2-பில்லியன் பேராமீட்டர் மாடல் வெளியிடப்பட்டுள்ளது.

தற்போது உள்நாட்டில் செயற்கை நுண்ணறிவு அடிப்படையிலான பெரிய மொழி மாதிரிகள் பெரிதளவில் இல்லை என்பது குறிப்பிடத்தக்கது. மக்கள் பெரும்பாலும் சாட்ஜிபிடி போன்ற (ChatGPT) ஆங்கிலம் சார்ந்த மொழி மாதிரிகளையே பயன்படுத்தி வருகின்றனர். இந்த சூழலில் பல இந்திய மொழிகளை சார்ந்து வந்திருக்கும் ‘சர்வம் 1’, உள்நாட்டு மக்களுக்கு தங்கள் தாய்மொழியில் AI பயன்பாட்டை எளிதாக அணுகக்கூடியதை உறுதிசெய்யும் என எதிர்பார்க்கப்படுகிறது.

சர்வம் 1 சிறப்புகள்:

டோக்கன் செயல்திறன் மற்றும் தரவுத் தரம் ஆகிய இரண்டு முக்கியமான பகுதிகள் மேம்படுத்தப்பட்டு ‘சர்வம் 1’ அறிமுகம் செய்யப்பட்டுள்ளது. முன்னதாக இருக்கும் AI மொழி மாதிரிகள், இந்திய மொழி வாக்கியத் தொகுப்புக்கு அதிக டோக்கன் தேவையை (ஒரு வார்த்தைக்கு தேவையான டோக்கன்களின் எண்ணிக்கை) வெளிப்படுத்துகின்றன.

ஆங்கிலத்திற்கு 1.4 உடன் ஒப்பிடும்போது ஒரு வார்த்தைக்கு 4-8 டோக்கன்கள் நம் உள்நாட்டு தாய்மொழிகளுக்குத் தேவைப்படுகின்றன. இதில் தான் சர்வம் 1 தன் மேம்பட்ட திறனை வெளிப்படுத்துகிறது. அதாவது ஆங்கிலத்திற்கு சற்றும் குறைவில்லாமல், 1.4 முதல் 2.1 டோக்கன்களால் இந்திய மொழி வாக்கியங்களை உருவாக்கலாம் என 'சர்வம் AI' தங்கள் பயன்பாடான, ‘சர்வம் 1’ வாயிலாக நிரூபித்துக் காட்டியுள்ளது.

இதையும் படிங்க
  1. வானில் பறந்தபடியே வீடியோ கால் பேசலாம்; கத்தார் ஏர்வேஸ் ஸ்டார்லிங்க் ஒப்பந்தம்!
  2. சமூக வலைத்தளங்களில் இளம் பெண்களை குறிவைத்து மோசடி செய்யும் கும்பல்!
  3. ஏஐ இல்லாத போன்களை மக்கள் விரும்பமாட்டார்கள் - கவுண்டர்பாயின்ட்

சர்வம் ஏஐ:

ஒரு பயனர் தங்களுக்குத் தேவையானத் தகவல்களை செயற்கை நுண்ணறிவு சார்ந்த பயன்பாட்டை அணுகும்போது, இணையம் மற்றும் செயற்கையாக உருவாக்கப்படும் தரவுகள் நியூரல் எஞ்சின்களால் செயல்படுத்தப்படும். அப்போது, ஆங்கிலம் அல்லாத உள்நாட்டு மொழிகளில் வாக்கிய அமைப்பு அவ்வளவு சரியானதாக இருப்பதில்லை.

அதாவது, ஒரு வார்த்தைக்கு பின் எந்த வார்த்தை வேண்டும் என்பதை செயற்கை நுண்ணறிவு சார்ந்த மொழி மாதிரிகள் சரியாகக் கணிக்கத் தவறுகின்றன. இந்த பிரச்சினையை, ‘சர்வம் 1’ போக்கும் என இதன் இணை நிறுவனரான பிரதியூஷ் குமார் தெரிவித்துள்ளார்.

etv bharat tamil nadu whatsapp channel link and QR Code
ஈடிவி பாரத் தமிழ்நாடு (ETV Bharat Tamil Nadu)

ஈடிவி பாரத் தமிழ் வாட்ஸ்ஆப் சேனலில் இணைய இங்கே கிளிக் செய்யவும்.

தொழில்நுட்பம் சார்ந்த அண்மை செய்திகளுக்கு ஈடிவி பாரத் தமிழ்நாடு 'டெக்னாலஜி' பக்கத்துடன் இணைந்திருங்கள்.

ETV Bharat Logo

Copyright © 2024 Ushodaya Enterprises Pvt. Ltd., All Rights Reserved.