ETV Bharat / science-and-technology

Meta AudioCraft: ಇದು ಪಠ್ಯದಿಂದ ಸುಮಧುರ ಸಂಗೀತ ಸೃಷ್ಟಿಸುವ AI ಚಾಟ್​ಬಾಟ್​ - ಎನ್‌ಕೋಡೆಕ್ ಮತ್ತು ಮ್ಯೂಸಿಕ್‌ಜೆನ್

Meta AudioCraft: ಪಠ್ಯದಿಂದ ಸಂಗೀತವನ್ನು ಸೃಷ್ಟಿ ಮಾಡುವ ಹೊಸ ಓಪನ್ ಸೋರ್ಸ್ AI ಸಾಧನವೊಂದನ್ನು ಮೆಟಾ ಬಿಡುಗಡೆ ಮಾಡಿದೆ.

Meta releases AudioCraft
Meta releases AudioCraft
author img

By

Published : Aug 3, 2023, 5:37 PM IST

ಬೆಂಗಳೂರು : ಮೆಟಾ (ಈ ಹಿಂದಿನ ಫೇಸ್‌ಬುಕ್) ಆಡಿಯೊಕ್ರಾಫ್ಟ್ ಎಂಬ ಹೊಸ ಓಪನ್ ಸೋರ್ಸ್ AI ಸಾಧನವೊಂದನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದೆ. ಈ ಜನರೇಟಿವ್ AI ಸಾಧನವು ಪಠ್ಯ ಪ್ರಾಂಪ್ಟ್‌ಗಳ ಮೂಲಕ ಸಂಗೀತ ಸೃಷ್ಟಿಸಬಲ್ಲದು. ಅಂದರೆ ನೀವು ಟೆಕ್ಸ್ಟ್ ಇನ್​ಪುಟ್ ಮಾಡಿದರೆ ಆ ಟೆಕ್ಸ್ಟ್​​ಗೆ ಅನುಗುಣವಾಗಿ ಈ ಚಾಟ್​ಬಾಟ್​ ಸಂಗೀತವನ್ನು ರಚನೆ ಮಾಡುತ್ತದೆ. ಸಾಧನವು ಆಡಿಯೊಜೆನ್, ಎನ್‌ಕೋಡೆಕ್ ಮತ್ತು ಮ್ಯೂಸಿಕ್‌ಜೆನ್ ಎಂಬ ಮೂರು ಜನರೇಟಿವ್ AI ಮಾದರಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ.

MusicGen ಎಂಬುದು ಸಂಗೀತವನ್ನು ಸೃಷ್ಟಿಸಲು ಪಠ್ಯ ಇನ್‌ಪುಟ್‌ಗಳನ್ನು ಬಳಸುವ ಸಾಧನವಾಗಿದೆ. ಮೆಟಾ ಒಡೆತನದಲ್ಲಿರುವ ಅಥವಾ ಈ ನಿರ್ದಿಷ್ಟ ಉದ್ದೇಶಕ್ಕಾಗಿ ಪರವಾನಗಿ ಪಡೆದಿರುವ 20,000 ಗಂಟೆಗಳ ಸಂಗೀತವನ್ನು ಬಳಸಿಕೊಂಡು ಇದಕ್ಕೆ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ. ಮೆಟಾದ ಎನ್‌ಕೋಡೆಕ್ ಡಿಕೋಡರ್ ಬಳಕೆದಾರರಿಗೆ ಕಡಿಮೆ ಕಲಾಕೃತಿಗಳೊಂದಿಗೆ ಶಬ್ದಗಳನ್ನು ರಚಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಆಡಿಯೊ ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್ ಅನ್ನು ವಿರೂಪಗೊಳಿಸುವುದನ್ನು ತಡೆಯುತ್ತದೆ. ಮತ್ತೊಂದೆಡೆ, ಆಡಿಯೊಜೆನ್, ಬೊಗಳುವ ನಾಯಿಗಳು ಅಥವಾ ಹೆಜ್ಜೆಗಳ ಶಬ್ದವನ್ನು ಅನುಕರಿಸುವಂತಹ ಲಿಖಿತ ಪ್ರಾಂಪ್ಟ್‌ಗಳ ಆಧಾರದ ಮೇಲೆ ಆಡಿಯೊವನ್ನು ರಚಿಸುತ್ತದೆ. ಇದಕ್ಕೆ ಸಾರ್ವಜನಿಕ ಸ್ಥಳಗಳಲ್ಲಿ ಕೇಳಿ ಬರುವ ಧ್ವನಿಗಳ ಬಗ್ಗೆ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ.

AI ಉತ್ಪಾದಿತ ಚಿತ್ರಗಳು ಮತ್ತು ಪಠ್ಯವು ಜನಪ್ರಿಯತೆಯನ್ನು ಗಳಿಸಿದ್ದರೂ, ಧ್ವನಿಯ ಬಗ್ಗೆ ಇನ್ನೂ ಅಂಥ ಜಾಗೃತಿ ಮೂಡಿಲ್ಲ ಎಂದು ಮೆಟಾ ಹೇಳಿದೆ. ಕಂಪನಿಯ ಪ್ರಕಾರ ಹಿಂದಿನ ಧ್ವನಿ ಸಾಧನಗಳು ಸಂಕೀರ್ಣವಾಗಿವೆ ಮತ್ತು ಅನೇಕರಿಗೆ ಬಳಸಲು ಕಷ್ಟಕರವಾಗಿವೆ. ರಚನೆಕಾರರು ತಮ್ಮ ಮಾದರಿಗಳನ್ನು ಕಸ್ಟಮೈಸ್ ಮಾಡಲು ಮತ್ತು ಸಾಧ್ಯವಿರುವಷ್ಟು ಮಟ್ಟಿಗೆ ಎಲ್ಲೆಗಳನ್ನು ಮೀರಲು ಅನುವು ಮಾಡಿಕೊಡುವ ಗುರಿಯನ್ನು ಹೊಸ ಟೂಲ್‌ಕಿಟ್ ಹೊಂದಿದೆ ಮತ್ತು ಕಂಪನಿಯು ಈ ಮಾದರಿಗಳನ್ನು ಸಂಶೋಧಕರಿಗೆ ಮುಕ್ತ-ಮೂಲವಾಗಿ (open-sourcing) ನೀಡುತ್ತಿದೆ. ಈ ಮಾದರಿಗಳಿಗೆ ಅವರು ತಮ್ಮ ಡೇಟಾಸೆಟ್‌ಗಳೊಂದಿಗೆ ತಮ್ಮದೇ ಆದ ರೀತಿಯಲ್ಲಿ ತರಬೇತಿ ನೀಡಬಹುದು.

"ಆಡಿಯೊ ಕ್ರಾಫ್ಟ್​ ಇದು ಸಂಗೀತ, ಧ್ವನಿ, ಸಂಕೋಚನ ಮತ್ತು ಜನರೇಶನ್​ ಹೀಗೆ ಎಲ್ಲವನ್ನೂ ಒಂದೇ ಕಡೆಗೆ ಒಳಗೊಂಡಿದೆ." ಎಂದು ಮೆಟಾ ಬ್ಲಾಗ್ ಪೋಸ್ಟ್‌ನಲ್ಲಿ ಹೇಳಿದೆ. ಈ ಆಡಿಯೊಕ್ರಾಫ್ಟ್‌ ಅನ್ನು ಸುಲಭವಾಗಿ ಬಳಸಬಹುದು ಮತ್ತು ಮರುಬಳಕೆ ಮಾಡಬಹುದು. ಹೀಗಾಗಿ ಉತ್ತಮ ಧ್ವನಿ ಜನರೇಟರ್‌ಗಳು, ಕಂಪ್ರೆಷನ್ ಅಲ್ಗಾರಿದಮ್‌ಗಳು ಅಥವಾ ಮ್ಯೂಸಿಕ್​​ ಜನರೇಟರ್‌ಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಆಸಕ್ತಿ ಹೊಂದಿರುವ ವ್ಯಕ್ತಿಗಳು ಈ ಸಾಧನವನ್ನು ಬಳಸಬಹುದು.

ಆದಾಗ್ಯೂ ಆಡಿಯೊ ಕ್ರಾಫ್ಟ್​ ಅನ್ನು ಸಾಮಾನ್ಯ ಬಳಕೆದಾರರಿಗಾಗಿ ತಯಾರಿಸಲಾಗಿಲ್ಲ. ಈ ಸಾಧನವನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಬಳಸಲು ತಾಂತ್ರಿಕ ಕೌಶಲ್ಯ ಬೇಕಾಗುತ್ತದೆ. ಕಂಪನಿಯ ಪ್ರಕಾರ ಇದನ್ನು ಪ್ರಾಥಮಿಕವಾಗಿ ಸಂಶೋಧನಾ ಉದ್ದೇಶಗಳಿಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಅಭಿವರ್ಧಕರು ಪ್ರಸ್ತುತ ತಮ್ಮ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ವಿಸ್ತರಿಸಲು ಈ ಮಾದರಿಗಳ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ನಿಯಂತ್ರಣ ವಿಧಾನಗಳನ್ನು ಹೆಚ್ಚಿಸುವಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದಾರೆ. ಇತ್ತೀಚೆಗೆ, ಗೂಗಲ್ ತನ್ನ ಟೆಕ್ಸ್ಟ್-ಟು-ಮ್ಯೂಸಿಕ್ ಟೂಲ್, MusicLM ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿತ್ತು.

ಇದನ್ನೂ ಓದಿ : 1 ಕೆಜಿಗಿಂತ ಹಗುರ HP Dragonfly G4 ಲ್ಯಾಪ್​ಟಾಪ್ ಬಿಡುಗಡೆ; ಬೆಲೆ 2 ಲಕ್ಷ 20 ಸಾವಿರ

ಬೆಂಗಳೂರು : ಮೆಟಾ (ಈ ಹಿಂದಿನ ಫೇಸ್‌ಬುಕ್) ಆಡಿಯೊಕ್ರಾಫ್ಟ್ ಎಂಬ ಹೊಸ ಓಪನ್ ಸೋರ್ಸ್ AI ಸಾಧನವೊಂದನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದೆ. ಈ ಜನರೇಟಿವ್ AI ಸಾಧನವು ಪಠ್ಯ ಪ್ರಾಂಪ್ಟ್‌ಗಳ ಮೂಲಕ ಸಂಗೀತ ಸೃಷ್ಟಿಸಬಲ್ಲದು. ಅಂದರೆ ನೀವು ಟೆಕ್ಸ್ಟ್ ಇನ್​ಪುಟ್ ಮಾಡಿದರೆ ಆ ಟೆಕ್ಸ್ಟ್​​ಗೆ ಅನುಗುಣವಾಗಿ ಈ ಚಾಟ್​ಬಾಟ್​ ಸಂಗೀತವನ್ನು ರಚನೆ ಮಾಡುತ್ತದೆ. ಸಾಧನವು ಆಡಿಯೊಜೆನ್, ಎನ್‌ಕೋಡೆಕ್ ಮತ್ತು ಮ್ಯೂಸಿಕ್‌ಜೆನ್ ಎಂಬ ಮೂರು ಜನರೇಟಿವ್ AI ಮಾದರಿಗಳನ್ನು ಒಳಗೊಂಡಿದೆ.

MusicGen ಎಂಬುದು ಸಂಗೀತವನ್ನು ಸೃಷ್ಟಿಸಲು ಪಠ್ಯ ಇನ್‌ಪುಟ್‌ಗಳನ್ನು ಬಳಸುವ ಸಾಧನವಾಗಿದೆ. ಮೆಟಾ ಒಡೆತನದಲ್ಲಿರುವ ಅಥವಾ ಈ ನಿರ್ದಿಷ್ಟ ಉದ್ದೇಶಕ್ಕಾಗಿ ಪರವಾನಗಿ ಪಡೆದಿರುವ 20,000 ಗಂಟೆಗಳ ಸಂಗೀತವನ್ನು ಬಳಸಿಕೊಂಡು ಇದಕ್ಕೆ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ. ಮೆಟಾದ ಎನ್‌ಕೋಡೆಕ್ ಡಿಕೋಡರ್ ಬಳಕೆದಾರರಿಗೆ ಕಡಿಮೆ ಕಲಾಕೃತಿಗಳೊಂದಿಗೆ ಶಬ್ದಗಳನ್ನು ರಚಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಆಡಿಯೊ ಮ್ಯಾನಿಪ್ಯುಲೇಷನ್ ಅನ್ನು ವಿರೂಪಗೊಳಿಸುವುದನ್ನು ತಡೆಯುತ್ತದೆ. ಮತ್ತೊಂದೆಡೆ, ಆಡಿಯೊಜೆನ್, ಬೊಗಳುವ ನಾಯಿಗಳು ಅಥವಾ ಹೆಜ್ಜೆಗಳ ಶಬ್ದವನ್ನು ಅನುಕರಿಸುವಂತಹ ಲಿಖಿತ ಪ್ರಾಂಪ್ಟ್‌ಗಳ ಆಧಾರದ ಮೇಲೆ ಆಡಿಯೊವನ್ನು ರಚಿಸುತ್ತದೆ. ಇದಕ್ಕೆ ಸಾರ್ವಜನಿಕ ಸ್ಥಳಗಳಲ್ಲಿ ಕೇಳಿ ಬರುವ ಧ್ವನಿಗಳ ಬಗ್ಗೆ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ.

AI ಉತ್ಪಾದಿತ ಚಿತ್ರಗಳು ಮತ್ತು ಪಠ್ಯವು ಜನಪ್ರಿಯತೆಯನ್ನು ಗಳಿಸಿದ್ದರೂ, ಧ್ವನಿಯ ಬಗ್ಗೆ ಇನ್ನೂ ಅಂಥ ಜಾಗೃತಿ ಮೂಡಿಲ್ಲ ಎಂದು ಮೆಟಾ ಹೇಳಿದೆ. ಕಂಪನಿಯ ಪ್ರಕಾರ ಹಿಂದಿನ ಧ್ವನಿ ಸಾಧನಗಳು ಸಂಕೀರ್ಣವಾಗಿವೆ ಮತ್ತು ಅನೇಕರಿಗೆ ಬಳಸಲು ಕಷ್ಟಕರವಾಗಿವೆ. ರಚನೆಕಾರರು ತಮ್ಮ ಮಾದರಿಗಳನ್ನು ಕಸ್ಟಮೈಸ್ ಮಾಡಲು ಮತ್ತು ಸಾಧ್ಯವಿರುವಷ್ಟು ಮಟ್ಟಿಗೆ ಎಲ್ಲೆಗಳನ್ನು ಮೀರಲು ಅನುವು ಮಾಡಿಕೊಡುವ ಗುರಿಯನ್ನು ಹೊಸ ಟೂಲ್‌ಕಿಟ್ ಹೊಂದಿದೆ ಮತ್ತು ಕಂಪನಿಯು ಈ ಮಾದರಿಗಳನ್ನು ಸಂಶೋಧಕರಿಗೆ ಮುಕ್ತ-ಮೂಲವಾಗಿ (open-sourcing) ನೀಡುತ್ತಿದೆ. ಈ ಮಾದರಿಗಳಿಗೆ ಅವರು ತಮ್ಮ ಡೇಟಾಸೆಟ್‌ಗಳೊಂದಿಗೆ ತಮ್ಮದೇ ಆದ ರೀತಿಯಲ್ಲಿ ತರಬೇತಿ ನೀಡಬಹುದು.

"ಆಡಿಯೊ ಕ್ರಾಫ್ಟ್​ ಇದು ಸಂಗೀತ, ಧ್ವನಿ, ಸಂಕೋಚನ ಮತ್ತು ಜನರೇಶನ್​ ಹೀಗೆ ಎಲ್ಲವನ್ನೂ ಒಂದೇ ಕಡೆಗೆ ಒಳಗೊಂಡಿದೆ." ಎಂದು ಮೆಟಾ ಬ್ಲಾಗ್ ಪೋಸ್ಟ್‌ನಲ್ಲಿ ಹೇಳಿದೆ. ಈ ಆಡಿಯೊಕ್ರಾಫ್ಟ್‌ ಅನ್ನು ಸುಲಭವಾಗಿ ಬಳಸಬಹುದು ಮತ್ತು ಮರುಬಳಕೆ ಮಾಡಬಹುದು. ಹೀಗಾಗಿ ಉತ್ತಮ ಧ್ವನಿ ಜನರೇಟರ್‌ಗಳು, ಕಂಪ್ರೆಷನ್ ಅಲ್ಗಾರಿದಮ್‌ಗಳು ಅಥವಾ ಮ್ಯೂಸಿಕ್​​ ಜನರೇಟರ್‌ಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಆಸಕ್ತಿ ಹೊಂದಿರುವ ವ್ಯಕ್ತಿಗಳು ಈ ಸಾಧನವನ್ನು ಬಳಸಬಹುದು.

ಆದಾಗ್ಯೂ ಆಡಿಯೊ ಕ್ರಾಫ್ಟ್​ ಅನ್ನು ಸಾಮಾನ್ಯ ಬಳಕೆದಾರರಿಗಾಗಿ ತಯಾರಿಸಲಾಗಿಲ್ಲ. ಈ ಸಾಧನವನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಬಳಸಲು ತಾಂತ್ರಿಕ ಕೌಶಲ್ಯ ಬೇಕಾಗುತ್ತದೆ. ಕಂಪನಿಯ ಪ್ರಕಾರ ಇದನ್ನು ಪ್ರಾಥಮಿಕವಾಗಿ ಸಂಶೋಧನಾ ಉದ್ದೇಶಗಳಿಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಅಭಿವರ್ಧಕರು ಪ್ರಸ್ತುತ ತಮ್ಮ ಸಾಮರ್ಥ್ಯಗಳನ್ನು ವಿಸ್ತರಿಸಲು ಈ ಮಾದರಿಗಳ ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ನಿಯಂತ್ರಣ ವಿಧಾನಗಳನ್ನು ಹೆಚ್ಚಿಸುವಲ್ಲಿ ಕೆಲಸ ಮಾಡುತ್ತಿದ್ದಾರೆ. ಇತ್ತೀಚೆಗೆ, ಗೂಗಲ್ ತನ್ನ ಟೆಕ್ಸ್ಟ್-ಟು-ಮ್ಯೂಸಿಕ್ ಟೂಲ್, MusicLM ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿತ್ತು.

ಇದನ್ನೂ ಓದಿ : 1 ಕೆಜಿಗಿಂತ ಹಗುರ HP Dragonfly G4 ಲ್ಯಾಪ್​ಟಾಪ್ ಬಿಡುಗಡೆ; ಬೆಲೆ 2 ಲಕ್ಷ 20 ಸಾವಿರ

ETV Bharat Logo

Copyright © 2025 Ushodaya Enterprises Pvt. Ltd., All Rights Reserved.