ETV Bharat / science-and-technology

ಮೆಟಾದ ಚಾಟ್​ಬಾಟ್​ CM3leon; ಪಠ್ಯ, ಚಿತ್ರ ವಿನ್ಯಾಸಕ್ಕೆ ಬಂದಿದೆ 'ಊಸರವಳ್ಳಿ'

ಮೆಟಾ ತನ್ನದೇ ಆದ ಹೊಸ ಆರ್ಟಿಫಿಶಿಯಲ್ ಇಂಟೆಲಿಜೆನ್ಸ್​ ತಂತ್ರಜ್ಞಾನವನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಿದೆ. ಇದಕ್ಕೆ CM3leon ಎಂದು ಹೆಸರಿಡಲಾಗಿದೆ.

Meta introduces generative AI model 'CM3leon' for text, images
Meta introduces generative AI model 'CM3leon' for text, images
author img

By

Published : Jul 16, 2023, 4:33 PM IST

ಸ್ಯಾನ್ ಫ್ರಾನ್ಸಿಸ್ಕೋ : ಫೇಸ್​ಬುಕ್​ನ ಮಾತೃ ಕಂಪನಿ ಮೆಟಾ ತನ್ನದೇ ಆದ ಆರ್ಟಿಫಿಶಿಯಲ್ ಇಂಟೆಲಿಜೆನ್ಸ್​ ತಂತ್ರಜ್ಞಾನವನ್ನು ಪರಿಚಯಿಸಿದೆ. ಇದಕ್ಕೆ CM3leon ಎಂದು ಹೆಸರಿಸಲಾಗಿದ್ದು, ಇದು ಪಠ್ಯದಿಂದ ಚಿತ್ರ ಮತ್ತು ಚಿತ್ರದಿಂದ ಪಠ್ಯವನ್ನು ವಿನ್ಯಾಸಗೊಳಿಸಬಲ್ಲದು. CM3leon ಪದವನ್ನು ಕಮೀಲಿಯನ್ ಎಂದು ಉಚ್ಚರಿಸಲಾಗುತ್ತದೆ. Chameleon ಎಂದರೆ ಕನ್ನಡದಲ್ಲಿ ಊಸರವಳ್ಳಿ ಅಥವಾ ಓತಿಕ್ಯಾತ ಎಂದರ್ಥ.

"CM3leon ಇದು ಪಠ್ಯ-ಮಾತ್ರ ಭಾಷಾ ಮಾದರಿಗಳಿಂದ ಅಳವಡಿಸಿಕೊಂಡ ವಿನ್ಯಾಸ ವಿಧಾನದಲ್ಲಿ ತರಬೇತಿ ಪಡೆದ ಮೊದಲ ಮಲ್ಟಿಮೋಡಲ್ ಮಾದರಿಯಾಗಿದೆ. ಇದು ದೊಡ್ಡ-ಪ್ರಮಾಣದ ಮರುಪಡೆಯುವಿಕೆ-ವರ್ಧಿತ ಪೂರ್ವ-ತರಬೇತಿ ಹಂತ (large-scale retrieval-augmented pre-training stage) ಮತ್ತು ಎರಡನೇ ಮಲ್ಟಿಟಾಸ್ಕ್ ಮೇಲ್ವಿಚಾರಣೆಯ ಸೂಕ್ಷ್ಮ-ಶ್ರುತಿ (second multitask supervised fine-tuning -SFT) ಹಂತಗಳಲ್ಲಿ ಸಹ ತರಬೇತಿ ಪಡೆದಿದೆ.

ಮೆಟಾ ಪ್ರಕಾರ, CM3leon ಗೆ ಕೇವಲ ಐದು ಪಟ್ಟು ಕಂಪ್ಯೂಟಿಂಗ್ ಶಕ್ತಿ ಮತ್ತು ಹಿಂದಿನ ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್ ಆಧಾರಿತ ವಿಧಾನಗಳಿಗಿಂತ ಚಿಕ್ಕದಾದ ತರಬೇತಿ ಡೇಟಾಸೆಟ್ ಸಾಕಾಗುತ್ತದೆ. ಈವರೆಗೆ ಹೆಚ್ಚು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾದ ಇಮೇಜ್ ಜನರೇಷನ್ ಬೆಂಚ್‌ಮಾರ್ಕ್ (ಶೂನ್ಯ-ಶಾಟ್ MS-COCO) ಗೆ ಹೋಲಿಸಿದರೆ, CM3Leon 4.88 ರ FID (ಫ್ರೆಚೆಟ್ ಇನ್ಸೆಪ್ಶನ್ ಡಿಸ್ಟೆನ್ಸ್) ಸ್ಕೋರ್ ಅನ್ನು ಸಾಧಿಸಿದೆ. ಪಠ್ಯದಿಂದ ಚಿತ್ರಕ್ಕೆ ಪರಿವರ್ತಿಸುವಲ್ಲಿ ಹೊಸ ಅತ್ಯಾಧುನಿಕತೆಯನ್ನು ಸಾಧಿಸಿದೆ ಮತ್ತು ಗೂಗಲ್‌ನ ಟೆಕ್ಸ್ಟ್-ಟು-ಇಮೇಜ್ ಮಾದರಿ Parti ಯನ್ನು ಮೀರಿಸುತ್ತಿದೆ.

CM3leon ದೃಷ್ಟಿ-ಭಾಷೆಯ ಕಾರ್ಯಗಳ ವ್ಯಾಪಕ ಶ್ರೇಣಿಯಲ್ಲಿ ಉತ್ಕೃಷ್ಟವಾಗಿದೆ. ಉದಾಹರಣೆಗೆ ದೃಶ್ಯ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸುವುದು ಮತ್ತು ದೀರ್ಘ-ರೂಪದ ಶೀರ್ಷಿಕೆಗಳನ್ನು ನೀಡುವುದರಲ್ಲಿ ಇದು ಪರಿಣಿತಿ ಹೊಂದಿದೆ ಎಂದು ಮೆಟಾ ಹೇಳಿದೆ. CM3Leon ನ ಶೂನ್ಯ-ಶಾಟ್ ಕಾರ್ಯಕ್ಷಮತೆಯು ಕೇವಲ ಮೂರು ಬಿಲಿಯನ್ ಪಠ್ಯ ಟೋಕನ್‌ಗಳ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ತರಬೇತಿ ಪಡೆದಿದ್ದರೂ ಸಹ, ದೊಡ್ಡ ಡೇಟಾಸೆಟ್‌ಗಳಲ್ಲಿ ತರಬೇತಿ ಪಡೆದ ದೊಡ್ಡ ಮಾದರಿಗಳಿಗಿಂತ ಅತ್ಯುತ್ತಮವಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ.

"ಉತ್ತಮ ಗುಣಮಟ್ಟದ ಜನರೇಟಿವ್ ಮಾಡೆಲ್​ಗಳನ್ನು ರಚಿಸುವ ಗುರಿಯೊಂದಿಗೆ, ವಿವಿಧ ಕಾರ್ಯಗಳಲ್ಲಿ CM3leon ನ ಬಲವಾದ ಕಾರ್ಯಕ್ಷಮತೆಯು ಉನ್ನತ-ನಿಷ್ಠೆಯ ಚಿತ್ರ ಉತ್ಪಾದನೆ ಮತ್ತು ತಿಳುವಳಿಕೆಯ ಕಡೆಗೆ ಒಂದು ಹೆಜ್ಜೆಯಾಗಿದೆ" ಎಂದು ಮೆಟಾ ಹೇಳಿದೆ. "CM3leon ನಂಥ ಮಾದರಿಗಳು ಅಂತಿಮವಾಗಿ ಸೃಜನಶೀಲತೆ ಮತ್ತು ಮೆಟಾವರ್ಸ್‌ನಲ್ಲಿ ಉತ್ತಮ ಅಪ್ಲಿಕೇಶನ್‌ಗಳನ್ನು ಹೆಚ್ಚಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ. ನಾವು ಮಲ್ಟಿಮೋಡಲ್ ಭಾಷಾ ಮಾದರಿಗಳ ಗಡಿಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಮತ್ತು ಭವಿಷ್ಯದಲ್ಲಿ ಹೆಚ್ಚಿನ ಮಾದರಿಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಲು ಎದುರು ನೋಡುತ್ತಿದ್ದೇವೆ" ಎಂದು ಅದು ತಿಳಿಸಿದೆ.

ಚಾಟ್‌ಬಾಟ್‌ಗಳು ಬಳಕೆದಾರರು ತಮ್ಮ ಪ್ರಶ್ನೆಗಳಿಗೆ ಪಠ್ಯ ಇನ್‌ಪುಟ್, ಆಡಿಯೊ ಇನ್‌ಪುಟ್ ಅಥವಾ ಎರಡರ ಮೂಲಕ-ಮಾನವ ಹಸ್ತಕ್ಷೇಪದ ಅಗತ್ಯವಿಲ್ಲದೆ ಪ್ರತಿಕ್ರಿಯಿಸುವ ಮೂಲಕ ಅಗತ್ಯವಿರುವ ಮಾಹಿತಿಯನ್ನು ಹುಡುಕಲು ಸುಲಭವಾಗಿಸಬಹುದು. ಮನೆಯಲ್ಲಿರುವ ಸ್ಮಾರ್ಟ್ ಸ್ಪೀಕರ್‌ಗಳಿಂದ ಹಿಡಿದು ಕೆಲಸದ ಸ್ಥಳದಲ್ಲಿ ಸಂದೇಶ ಕಳುಹಿಸುವ ಅಪ್ಲಿಕೇಶನ್‌ಗಳವರೆಗೆ ಚಾಟ್‌ಬಾಟ್ ತಂತ್ರಜ್ಞಾನವು ಈ ದಿನಗಳಲ್ಲಿ ಬಹುತೇಕ ಎಲ್ಲೆಡೆ ವ್ಯಾಪಿಸಿದೆ.

ಇದನ್ನೂ ಓದಿ : Twitter ಸಾಲದ ಹೊರೆ ಹೆಚ್ಚಳ, ಆದಾಯ ಸಾಕಾಗುತ್ತಿಲ್ಲ: ಎಲೋನ್ ಮಸ್ಕ್​

ಸ್ಯಾನ್ ಫ್ರಾನ್ಸಿಸ್ಕೋ : ಫೇಸ್​ಬುಕ್​ನ ಮಾತೃ ಕಂಪನಿ ಮೆಟಾ ತನ್ನದೇ ಆದ ಆರ್ಟಿಫಿಶಿಯಲ್ ಇಂಟೆಲಿಜೆನ್ಸ್​ ತಂತ್ರಜ್ಞಾನವನ್ನು ಪರಿಚಯಿಸಿದೆ. ಇದಕ್ಕೆ CM3leon ಎಂದು ಹೆಸರಿಸಲಾಗಿದ್ದು, ಇದು ಪಠ್ಯದಿಂದ ಚಿತ್ರ ಮತ್ತು ಚಿತ್ರದಿಂದ ಪಠ್ಯವನ್ನು ವಿನ್ಯಾಸಗೊಳಿಸಬಲ್ಲದು. CM3leon ಪದವನ್ನು ಕಮೀಲಿಯನ್ ಎಂದು ಉಚ್ಚರಿಸಲಾಗುತ್ತದೆ. Chameleon ಎಂದರೆ ಕನ್ನಡದಲ್ಲಿ ಊಸರವಳ್ಳಿ ಅಥವಾ ಓತಿಕ್ಯಾತ ಎಂದರ್ಥ.

"CM3leon ಇದು ಪಠ್ಯ-ಮಾತ್ರ ಭಾಷಾ ಮಾದರಿಗಳಿಂದ ಅಳವಡಿಸಿಕೊಂಡ ವಿನ್ಯಾಸ ವಿಧಾನದಲ್ಲಿ ತರಬೇತಿ ಪಡೆದ ಮೊದಲ ಮಲ್ಟಿಮೋಡಲ್ ಮಾದರಿಯಾಗಿದೆ. ಇದು ದೊಡ್ಡ-ಪ್ರಮಾಣದ ಮರುಪಡೆಯುವಿಕೆ-ವರ್ಧಿತ ಪೂರ್ವ-ತರಬೇತಿ ಹಂತ (large-scale retrieval-augmented pre-training stage) ಮತ್ತು ಎರಡನೇ ಮಲ್ಟಿಟಾಸ್ಕ್ ಮೇಲ್ವಿಚಾರಣೆಯ ಸೂಕ್ಷ್ಮ-ಶ್ರುತಿ (second multitask supervised fine-tuning -SFT) ಹಂತಗಳಲ್ಲಿ ಸಹ ತರಬೇತಿ ಪಡೆದಿದೆ.

ಮೆಟಾ ಪ್ರಕಾರ, CM3leon ಗೆ ಕೇವಲ ಐದು ಪಟ್ಟು ಕಂಪ್ಯೂಟಿಂಗ್ ಶಕ್ತಿ ಮತ್ತು ಹಿಂದಿನ ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್ ಆಧಾರಿತ ವಿಧಾನಗಳಿಗಿಂತ ಚಿಕ್ಕದಾದ ತರಬೇತಿ ಡೇಟಾಸೆಟ್ ಸಾಕಾಗುತ್ತದೆ. ಈವರೆಗೆ ಹೆಚ್ಚು ವ್ಯಾಪಕವಾಗಿ ಬಳಸಲಾದ ಇಮೇಜ್ ಜನರೇಷನ್ ಬೆಂಚ್‌ಮಾರ್ಕ್ (ಶೂನ್ಯ-ಶಾಟ್ MS-COCO) ಗೆ ಹೋಲಿಸಿದರೆ, CM3Leon 4.88 ರ FID (ಫ್ರೆಚೆಟ್ ಇನ್ಸೆಪ್ಶನ್ ಡಿಸ್ಟೆನ್ಸ್) ಸ್ಕೋರ್ ಅನ್ನು ಸಾಧಿಸಿದೆ. ಪಠ್ಯದಿಂದ ಚಿತ್ರಕ್ಕೆ ಪರಿವರ್ತಿಸುವಲ್ಲಿ ಹೊಸ ಅತ್ಯಾಧುನಿಕತೆಯನ್ನು ಸಾಧಿಸಿದೆ ಮತ್ತು ಗೂಗಲ್‌ನ ಟೆಕ್ಸ್ಟ್-ಟು-ಇಮೇಜ್ ಮಾದರಿ Parti ಯನ್ನು ಮೀರಿಸುತ್ತಿದೆ.

CM3leon ದೃಷ್ಟಿ-ಭಾಷೆಯ ಕಾರ್ಯಗಳ ವ್ಯಾಪಕ ಶ್ರೇಣಿಯಲ್ಲಿ ಉತ್ಕೃಷ್ಟವಾಗಿದೆ. ಉದಾಹರಣೆಗೆ ದೃಶ್ಯ ಪ್ರಶ್ನೆಗೆ ಉತ್ತರಿಸುವುದು ಮತ್ತು ದೀರ್ಘ-ರೂಪದ ಶೀರ್ಷಿಕೆಗಳನ್ನು ನೀಡುವುದರಲ್ಲಿ ಇದು ಪರಿಣಿತಿ ಹೊಂದಿದೆ ಎಂದು ಮೆಟಾ ಹೇಳಿದೆ. CM3Leon ನ ಶೂನ್ಯ-ಶಾಟ್ ಕಾರ್ಯಕ್ಷಮತೆಯು ಕೇವಲ ಮೂರು ಬಿಲಿಯನ್ ಪಠ್ಯ ಟೋಕನ್‌ಗಳ ಡೇಟಾಸೆಟ್‌ನಲ್ಲಿ ತರಬೇತಿ ಪಡೆದಿದ್ದರೂ ಸಹ, ದೊಡ್ಡ ಡೇಟಾಸೆಟ್‌ಗಳಲ್ಲಿ ತರಬೇತಿ ಪಡೆದ ದೊಡ್ಡ ಮಾದರಿಗಳಿಗಿಂತ ಅತ್ಯುತ್ತಮವಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ.

"ಉತ್ತಮ ಗುಣಮಟ್ಟದ ಜನರೇಟಿವ್ ಮಾಡೆಲ್​ಗಳನ್ನು ರಚಿಸುವ ಗುರಿಯೊಂದಿಗೆ, ವಿವಿಧ ಕಾರ್ಯಗಳಲ್ಲಿ CM3leon ನ ಬಲವಾದ ಕಾರ್ಯಕ್ಷಮತೆಯು ಉನ್ನತ-ನಿಷ್ಠೆಯ ಚಿತ್ರ ಉತ್ಪಾದನೆ ಮತ್ತು ತಿಳುವಳಿಕೆಯ ಕಡೆಗೆ ಒಂದು ಹೆಜ್ಜೆಯಾಗಿದೆ" ಎಂದು ಮೆಟಾ ಹೇಳಿದೆ. "CM3leon ನಂಥ ಮಾದರಿಗಳು ಅಂತಿಮವಾಗಿ ಸೃಜನಶೀಲತೆ ಮತ್ತು ಮೆಟಾವರ್ಸ್‌ನಲ್ಲಿ ಉತ್ತಮ ಅಪ್ಲಿಕೇಶನ್‌ಗಳನ್ನು ಹೆಚ್ಚಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತವೆ. ನಾವು ಮಲ್ಟಿಮೋಡಲ್ ಭಾಷಾ ಮಾದರಿಗಳ ಗಡಿಗಳನ್ನು ಅನ್ವೇಷಿಸಲು ಮತ್ತು ಭವಿಷ್ಯದಲ್ಲಿ ಹೆಚ್ಚಿನ ಮಾದರಿಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಲು ಎದುರು ನೋಡುತ್ತಿದ್ದೇವೆ" ಎಂದು ಅದು ತಿಳಿಸಿದೆ.

ಚಾಟ್‌ಬಾಟ್‌ಗಳು ಬಳಕೆದಾರರು ತಮ್ಮ ಪ್ರಶ್ನೆಗಳಿಗೆ ಪಠ್ಯ ಇನ್‌ಪುಟ್, ಆಡಿಯೊ ಇನ್‌ಪುಟ್ ಅಥವಾ ಎರಡರ ಮೂಲಕ-ಮಾನವ ಹಸ್ತಕ್ಷೇಪದ ಅಗತ್ಯವಿಲ್ಲದೆ ಪ್ರತಿಕ್ರಿಯಿಸುವ ಮೂಲಕ ಅಗತ್ಯವಿರುವ ಮಾಹಿತಿಯನ್ನು ಹುಡುಕಲು ಸುಲಭವಾಗಿಸಬಹುದು. ಮನೆಯಲ್ಲಿರುವ ಸ್ಮಾರ್ಟ್ ಸ್ಪೀಕರ್‌ಗಳಿಂದ ಹಿಡಿದು ಕೆಲಸದ ಸ್ಥಳದಲ್ಲಿ ಸಂದೇಶ ಕಳುಹಿಸುವ ಅಪ್ಲಿಕೇಶನ್‌ಗಳವರೆಗೆ ಚಾಟ್‌ಬಾಟ್ ತಂತ್ರಜ್ಞಾನವು ಈ ದಿನಗಳಲ್ಲಿ ಬಹುತೇಕ ಎಲ್ಲೆಡೆ ವ್ಯಾಪಿಸಿದೆ.

ಇದನ್ನೂ ಓದಿ : Twitter ಸಾಲದ ಹೊರೆ ಹೆಚ್ಚಳ, ಆದಾಯ ಸಾಕಾಗುತ್ತಿಲ್ಲ: ಎಲೋನ್ ಮಸ್ಕ್​

ETV Bharat Logo

Copyright © 2024 Ushodaya Enterprises Pvt. Ltd., All Rights Reserved.