ହାଇଦ୍ରାବାଦ: ଦିନକୁ ଦିନ ଏପରି ଟେକ୍ନୋଲୋଜି ଆସୁଛି ଯାହାକି ମାନବ ଜଗତକୁ ଆଶ୍ଚର୍ଯ୍ୟଚକିତ କରୁଛି । AI ଟେକ୍ନୋଲୋଜିକୁ ଆମେ ଏବେ ବିଭିନ୍ନ କ୍ଷେତ୍ରରେ ବ୍ୟବହାର କରୁଛି । ହେଲେ ଆମେରିକାର ଜିପିୟୁ ନିର୍ମାତା କମ୍ପାନୀ ଏନଭିଡିଆ (nVIDIA) ଏପରି ଏକ ଏଆଇ ଟୁଲ୍ ଆଣିଛି ଯାହାକି କିଛି ଲେଖା ମାଧ୍ୟମରୁ ଆପଣଙ୍କୁ ନୂଆ ଗୀତ ତିଆରି କରିଦେବ । ଯାହାକୁ ଆପଣ ପୂର୍ବରୁ କେବେ ବି ଶୁଣିନଥିବେ । ଏହି AI ଟୁଲ୍ର ନାମ କମ୍ପାନୀ ଫୁଗାଟୋ ( Fugatto) ରଖିଛି ।
Nvidia ଗବେଷକମାନେ ଫୁଗାଟୋ ନାମକ ଏହି ନୂତନ AI ଅଡିଓ ଜେନେରେଟର ସୃଷ୍ଟି କରିଛନ୍ତି । ଏହା ୟୁଜରମାନଙ୍କୁ ସରଳ ପାଠ୍ୟ ପ୍ରମ୍ପ୍ଟ ସହିତ ଅଡିଓ ଏଡିଟ୍ କିମ୍ବା ଜେନେରେଟ୍ କରିବାକୁ ଅନୁମତି ଦେଇଥାଏ । ସେମିକଣ୍ଡକ୍ଟର ଜାଏଣ୍ଟ ନଭେମ୍ବର 25 ତାରିଖରେ ଏକ ବ୍ଲଗ୍ ପୋଷ୍ଟ ମାଧ୍ୟମରେ ଏହି ନୂଆ ଏଆଇ ଟୁଲ୍ ସମ୍ପର୍କରେ ସୂଚନା ଦେଇଛି ।
କଣ କରିପାରିବ 'Fugatto' ?
- ପାଠ୍ୟ ବର୍ଣ୍ଣନା (Text Description)ରୁ ସାଉଣ୍ଡ ଇଫେକ୍ଟ ଏବଂ ସଙ୍ଗୀତ ସୃଷ୍ଟି କରିପାରିବ ।
- ପୂର୍ବରୁ ଥିବା ଯେକୌଣସି ଅଡିଓକୁ ରୂପାନ୍ତରିତ କରିପାରିବ, ଯେପରିକି ପିଆନୋ ମେଲୋଡିକୁ ମାନବ ଗାୟକ ସ୍ବରରେ ପରିଣତ କରିପାରିବ ।
- ପୂର୍ବରୁ ଥିବା ରେକର୍ଡିଂର ଉଚ୍ଚାରଣ ଏବଂ ଭାବପ୍ରବଣ ସ୍ବରକୁ ମଧ୍ୟ ପରିବର୍ତ୍ତନ କରିପାରିବ । ଅର୍ଥାତ ଆପଣ କିଛି ଲେଖା ଦେଲେ ଏହା ତାହାକୁ ରାଗିବା ଓ ଶାନ୍ତ ସ୍ବରରେ ଏକ ଅଡିଓ ଜେନେରେଟ୍ କରିଦେବ ।
- ଏକ ବିଜ୍ଞାପନ ଏଜେନ୍ସି ଏହାକୁ ଭଏସ୍ ଓଭରରେ ବିଭିନ୍ନ ଉଚ୍ଚାରଣ ଏବଂ ଭାବନା ପ୍ରୟୋଗ କରି ଏକାଧିକ ଭାଷାଭାଷୀ ଅଞ୍ଚଳ ପାଇଁ ବିଜ୍ଞାପନ ପ୍ରସ୍ତୁତ କରିବାରେ ବ୍ୟବହାର କରିପାରିବେ ।
ଏହା ବି ପଢନ୍ତୁ |
🎵 ✨The world’s most flexible sound machine?
— NVIDIA AI Developer (@NVIDIAAIDev) November 25, 2024
With text and audio inputs, this new #generativeAI model, named Fugatto, can create any combination of music, voices, and sounds.🎹
Read more in our blog by @RichardKerris ➡️ https://t.co/AvTAbjn1iJ #NVIDIAResearch
Note: Some… pic.twitter.com/0IlYboF9JZ
ରିଲିଜ ହେବ କି ଏହି ଟୁଲ୍ ?
ଜେନେରେଟିଭ୍ ଏଆଇ ମଡେଲଗୁଡିକ ରିଲିଜ ଏକ ବିବାଦୀୟ ବିଷୟ ହୋଇପଡ଼ିଛି । ବିଶେଷକରି ମନୋରଞ୍ଜନ କ୍ଷେତ୍ରରେ ଯେଉଁଠାରେ କପିରାଇଟ୍ ଏବଂ ଭଏସ୍ ଅନୁକରଣ ପ୍ରସଙ୍ଗ ଆଦି ରହିଛି ସେଠାରେ ଏପରି ଟୁଲ୍ର ବ୍ୟବହାର ସମସ୍ୟା ସୃଷ୍ଟି କରିପାରେ । ଅପବ୍ୟବହାର ଓ କପିରାଇଟ୍ ଉଲ୍ଲଂଘନ ନେଇ ସମ୍ଭାବ୍ୟ ଯୋଗୁଁ ଏହାକୁ ସାର୍ବଜନୀନ କରିବା ବିପଦପୂର୍ଣ୍ଣ ହୋଇପାରେ ବୋଲି ଏନଭିଡିଆ କହିଛି ।
ସାର୍ବଜନୀନ ପାଇଁ କୁଣ୍ଠିତ Nvidia ?
ଏହି ଏଆଇ ଟୁଲ୍ଟି ଭାରତ, ବ୍ରାଜିଲ, ଚୀନ, ଜୋର୍ଡାନ ଏବଂ ଦକ୍ଷିଣ କୋରିଆ ସମେତ ବିଶ୍ବର ବିଭିନ୍ନ ଲୋକଙ୍କ ଦ୍ବାରା ପ୍ରସ୍ତୁତ କରାଯାଇଥିଲା । Nvidia ଦାବି କରିଛି ଯେ ଏହା Fugattoର ଏକାଧିକ ଉଚ୍ଚାରଣ ଏବଂ ବହୁଭାଷୀ କ୍ଷମତାକୁ ଅଧିକ ଶକ୍ତିଶାଳୀ କରିଛି । ୟୁଜରଙ୍କ ନିର୍ଦ୍ଦେଶନାମାକୁ ମିଶ୍ରଣ କରିବା ପାଇଁ ମଡେଲ୍ କମ୍ପୋଜେବଲ୍ ଆର୍ଟ (ComposableART) ନାମକ ଏକ ଟେକିନିକ୍ର ବ୍ୟବହାର କରାଯାଇଛି । ଉଦାହରଣ ସ୍ବରୂପ, ୟୁଜର କିଛି ଲେଖା ଦେଇ ଫ୍ରେଞ୍ଚ ଉଚ୍ଚାରଣ ଶୈଳୀରେ ଏହାର ସ୍ବର ମାଗିପାରେ । ଏହି ଟୁଲ୍ ସଙ୍ଗେ ସଙ୍ଗେ ଉକ୍ତ ଲେଖା ସହିତ ଏକ ଫ୍ରେଞ୍ଚ ସ୍ବର ସହିତ ଅଡିଓ ପଠାଇପାରିବ । ଏହାକୁ ସଠିକ ଦିଗରେ ବ୍ୟବହାର କଲେ ଏହା ନିଶ୍ଚିତ ବେଶ ଉପକାରୀ । କିନ୍ତୁ ସମ୍ପ୍ରତି ଏହାକୁ ଅସାଧୁ ଉପାୟରେ ବ୍ୟବହାର କରିବାର ଅଧିକ ସମ୍ଭାବନା ରହିଛି । ଏଣୁ କମ୍ପାନୀ ଏହି ଟୁଲ୍କୁ ସାର୍ବଜନୀନ କରିବା ଦିଗରେ କୁଣ୍ଠାବୋଧ କରିଛି ।