ETV Bharat / technology

Text ଦେଲେ ଗୀତ ବନାଇଦେବ 'Fugatto'; nVIDIA ଆଣିଲା ନୂଆ AI ଟୁଲ୍‌

ଆମେରିକୀୟ କମ୍ପାନୀ ଏନଭିଡିଆ ଏପରି ଏକ AI ଟୁଲ୍‌ ଆଣିଛି, ଯାହାକି ଆପଣ କିଛି ଲେଖା ଦେଲେ ଏହା ଆପଣଙ୍କୁ ସଂଗୀତ ତିଆରି କରିଦେବ । ଯାହାକି ଆପଣ କେବେ ପୂର୍ବରୁ ଶୁଣିନଥିବେ ।

NVIDIA launches new AI model Fugatto
NVIDIA launches new AI model Fugatto (Credit- NVIDIA)
author img

By ETV Bharat Tech Team

Published : Nov 27, 2024, 6:11 PM IST

ହାଇଦ୍ରାବାଦ: ଦିନକୁ ଦିନ ଏପରି ଟେକ୍ନୋଲୋଜି ଆସୁଛି ଯାହାକି ମାନବ ଜଗତକୁ ଆଶ୍ଚର୍ଯ୍ୟଚକିତ କରୁଛି । AI ଟେକ୍ନୋଲୋଜିକୁ ଆମେ ଏବେ ବିଭିନ୍ନ କ୍ଷେତ୍ରରେ ବ୍ୟବହାର କରୁଛି । ହେଲେ ଆମେରିକାର ଜିପିୟୁ ନିର୍ମାତା କମ୍ପାନୀ ଏନଭିଡିଆ (nVIDIA) ଏପରି ଏକ ଏଆଇ ଟୁଲ୍‌ ଆଣିଛି ଯାହାକି କିଛି ଲେଖା ମାଧ୍ୟମରୁ ଆପଣଙ୍କୁ ନୂଆ ଗୀତ ତିଆରି କରିଦେବ । ଯାହାକୁ ଆପଣ ପୂର୍ବରୁ କେବେ ବି ଶୁଣିନଥିବେ । ଏହି AI ଟୁଲ୍‌ର ନାମ କମ୍ପାନୀ ଫୁଗାଟୋ ( Fugatto) ରଖିଛି ।

Nvidia ଗବେଷକମାନେ ଫୁଗାଟୋ ନାମକ ଏହି ନୂତନ AI ଅଡିଓ ଜେନେରେଟର ସୃଷ୍ଟି କରିଛନ୍ତି । ଏହା ୟୁଜରମାନଙ୍କୁ ସରଳ ପାଠ୍ୟ ପ୍ରମ୍ପ୍ଟ ସହିତ ଅଡିଓ ଏଡିଟ୍ କିମ୍ବା ଜେନେରେଟ୍ କରିବାକୁ ଅନୁମତି ଦେଇଥାଏ । ସେମିକଣ୍ଡକ୍ଟର ଜାଏଣ୍ଟ ନଭେମ୍ବର 25 ତାରିଖରେ ଏକ ବ୍ଲଗ୍‌ ପୋଷ୍ଟ ମାଧ୍ୟମରେ ଏହି ନୂଆ ଏଆଇ ଟୁଲ୍‌ ସମ୍ପର୍କରେ ସୂଚନା ଦେଇଛି ।

AI model Fugatto
ଗୀତରୁ କେବଳ ସ୍ବରକୁ ଅଲଗା କରୁଛି 'ଫୁଗାଟୋ' (Credit- NVIDIA)

କଣ କରିପାରିବ 'Fugatto' ?

  • ପାଠ୍ୟ ବର୍ଣ୍ଣନା (Text Description)ରୁ ସାଉଣ୍ଡ ଇଫେକ୍ଟ ଏବଂ ସଙ୍ଗୀତ ସୃଷ୍ଟି କରିପାରିବ ।
  • ପୂର୍ବରୁ ଥିବା ଯେକୌଣସି ଅଡିଓକୁ ରୂପାନ୍ତରିତ କରିପାରିବ, ଯେପରିକି ପିଆନୋ ମେଲୋଡିକୁ ମାନବ ଗାୟକ ସ୍ବରରେ ପରିଣତ କରିପାରିବ ।
  • ପୂର୍ବରୁ ଥିବା ରେକର୍ଡିଂର ଉଚ୍ଚାରଣ ଏବଂ ଭାବପ୍ରବଣ ସ୍ବରକୁ ମଧ୍ୟ ପରିବର୍ତ୍ତନ କରିପାରିବ । ଅର୍ଥାତ ଆପଣ କିଛି ଲେଖା ଦେଲେ ଏହା ତାହାକୁ ରାଗିବା ଓ ଶାନ୍ତ ସ୍ବରରେ ଏକ ଅଡିଓ ଜେନେରେଟ୍‌ କରିଦେବ ।
  • ଏକ ବିଜ୍ଞାପନ ଏଜେନ୍ସି ଏହାକୁ ଭଏସ୍ ଓଭରରେ ବିଭିନ୍ନ ଉଚ୍ଚାରଣ ଏବଂ ଭାବନା ପ୍ରୟୋଗ କରି ଏକାଧିକ ଭାଷାଭାଷୀ ଅଞ୍ଚଳ ପାଇଁ ବିଜ୍ଞାପନ ପ୍ରସ୍ତୁତ କରିବାରେ ବ୍ୟବହାର କରିପାରିବେ ।
ଏହା ବି ପଢନ୍ତୁ
  1. Appleକୁ ପଛରେ ଛାଡ଼ିଲା Nvidia; AI ଯୁଗରେ ହେଲା ବିଶ୍ବର ବୃହତ୍ତମ କମ୍ପାନୀ
  2. Googleକୁ ପୁଣି ଚିନ୍ତାରେ ପକାଇଲା OpenAI; ସର୍ଚ୍ଚ ଇଞ୍ଜିନ ପରେ ଆଣୁଛି Browser

ରିଲିଜ ହେବ କି ଏହି ଟୁଲ୍‌ ?

ଜେନେରେଟିଭ୍ ଏଆଇ ମଡେଲଗୁଡିକ ରିଲିଜ ଏକ ବିବାଦୀୟ ବିଷୟ ହୋଇପଡ଼ିଛି । ବିଶେଷକରି ମନୋରଞ୍ଜନ କ୍ଷେତ୍ରରେ ଯେଉଁଠାରେ କପିରାଇଟ୍ ଏବଂ ଭଏସ୍ ଅନୁକରଣ ପ୍ରସଙ୍ଗ ଆଦି ରହିଛି ସେଠାରେ ଏପରି ଟୁଲ୍‌ର ବ୍ୟବହାର ସମସ୍ୟା ସୃଷ୍ଟି କରିପାରେ । ଅପବ୍ୟବହାର ଓ କପିରାଇଟ୍ ଉଲ୍ଲଂଘନ ନେଇ ସମ୍ଭାବ୍ୟ ଯୋଗୁଁ ଏହାକୁ ସାର୍ବଜନୀନ କରିବା ବିପଦପୂର୍ଣ୍ଣ ହୋଇପାରେ ବୋଲି ଏନଭିଡିଆ କହିଛି ।

AI model Fugatto
ନିର୍ଦ୍ଦେଶ ଅନୁସାରେ ଶାନ୍ତ ସ୍ବର ତିଆରି କରୁଛି 'ଫୁଗାଟୋ' (Credit- NVIDIA)

ସାର୍ବଜନୀନ ପାଇଁ କୁଣ୍ଠିତ Nvidia ?

ଏହି ଏଆଇ ଟୁଲ୍‌ଟି ଭାରତ, ବ୍ରାଜିଲ, ଚୀନ, ଜୋର୍ଡାନ ଏବଂ ଦକ୍ଷିଣ କୋରିଆ ସମେତ ବିଶ୍ବର ବିଭିନ୍ନ ଲୋକଙ୍କ ଦ୍ବାରା ପ୍ରସ୍ତୁତ କରାଯାଇଥିଲା । Nvidia ଦାବି କରିଛି ଯେ ଏହା Fugattoର ଏକାଧିକ ଉଚ୍ଚାରଣ ଏବଂ ବହୁଭାଷୀ କ୍ଷମତାକୁ ଅଧିକ ଶକ୍ତିଶାଳୀ କରିଛି । ୟୁଜରଙ୍କ ନିର୍ଦ୍ଦେଶନାମାକୁ ମିଶ୍ରଣ କରିବା ପାଇଁ ମଡେଲ୍ କମ୍ପୋଜେବଲ୍ ଆର୍ଟ (ComposableART) ନାମକ ଏକ ଟେକିନିକ୍‌ର ବ୍ୟବହାର କରାଯାଇଛି । ଉଦାହରଣ ସ୍ବରୂପ, ୟୁଜର କିଛି ଲେଖା ଦେଇ ଫ୍ରେଞ୍ଚ ଉଚ୍ଚାରଣ ଶୈଳୀରେ ଏହାର ସ୍ବର ମାଗିପାରେ । ଏହି ଟୁଲ୍‌ ସଙ୍ଗେ ସଙ୍ଗେ ଉକ୍ତ ଲେଖା ସହିତ ଏକ ଫ୍ରେଞ୍ଚ ସ୍ବର ସହିତ ଅଡିଓ ପଠାଇପାରିବ । ଏହାକୁ ସଠିକ ଦିଗରେ ବ୍ୟବହାର କଲେ ଏହା ନିଶ୍ଚିତ ବେଶ ଉପକାରୀ । କିନ୍ତୁ ସମ୍ପ୍ରତି ଏହାକୁ ଅସାଧୁ ଉପାୟରେ ବ୍ୟବହାର କରିବାର ଅଧିକ ସମ୍ଭାବନା ରହିଛି । ଏଣୁ କମ୍ପାନୀ ଏହି ଟୁଲ୍‌କୁ ସାର୍ବଜନୀନ କରିବା ଦିଗରେ କୁଣ୍ଠାବୋଧ କରିଛି ।

ହାଇଦ୍ରାବାଦ: ଦିନକୁ ଦିନ ଏପରି ଟେକ୍ନୋଲୋଜି ଆସୁଛି ଯାହାକି ମାନବ ଜଗତକୁ ଆଶ୍ଚର୍ଯ୍ୟଚକିତ କରୁଛି । AI ଟେକ୍ନୋଲୋଜିକୁ ଆମେ ଏବେ ବିଭିନ୍ନ କ୍ଷେତ୍ରରେ ବ୍ୟବହାର କରୁଛି । ହେଲେ ଆମେରିକାର ଜିପିୟୁ ନିର୍ମାତା କମ୍ପାନୀ ଏନଭିଡିଆ (nVIDIA) ଏପରି ଏକ ଏଆଇ ଟୁଲ୍‌ ଆଣିଛି ଯାହାକି କିଛି ଲେଖା ମାଧ୍ୟମରୁ ଆପଣଙ୍କୁ ନୂଆ ଗୀତ ତିଆରି କରିଦେବ । ଯାହାକୁ ଆପଣ ପୂର୍ବରୁ କେବେ ବି ଶୁଣିନଥିବେ । ଏହି AI ଟୁଲ୍‌ର ନାମ କମ୍ପାନୀ ଫୁଗାଟୋ ( Fugatto) ରଖିଛି ।

Nvidia ଗବେଷକମାନେ ଫୁଗାଟୋ ନାମକ ଏହି ନୂତନ AI ଅଡିଓ ଜେନେରେଟର ସୃଷ୍ଟି କରିଛନ୍ତି । ଏହା ୟୁଜରମାନଙ୍କୁ ସରଳ ପାଠ୍ୟ ପ୍ରମ୍ପ୍ଟ ସହିତ ଅଡିଓ ଏଡିଟ୍ କିମ୍ବା ଜେନେରେଟ୍ କରିବାକୁ ଅନୁମତି ଦେଇଥାଏ । ସେମିକଣ୍ଡକ୍ଟର ଜାଏଣ୍ଟ ନଭେମ୍ବର 25 ତାରିଖରେ ଏକ ବ୍ଲଗ୍‌ ପୋଷ୍ଟ ମାଧ୍ୟମରେ ଏହି ନୂଆ ଏଆଇ ଟୁଲ୍‌ ସମ୍ପର୍କରେ ସୂଚନା ଦେଇଛି ।

AI model Fugatto
ଗୀତରୁ କେବଳ ସ୍ବରକୁ ଅଲଗା କରୁଛି 'ଫୁଗାଟୋ' (Credit- NVIDIA)

କଣ କରିପାରିବ 'Fugatto' ?

  • ପାଠ୍ୟ ବର୍ଣ୍ଣନା (Text Description)ରୁ ସାଉଣ୍ଡ ଇଫେକ୍ଟ ଏବଂ ସଙ୍ଗୀତ ସୃଷ୍ଟି କରିପାରିବ ।
  • ପୂର୍ବରୁ ଥିବା ଯେକୌଣସି ଅଡିଓକୁ ରୂପାନ୍ତରିତ କରିପାରିବ, ଯେପରିକି ପିଆନୋ ମେଲୋଡିକୁ ମାନବ ଗାୟକ ସ୍ବରରେ ପରିଣତ କରିପାରିବ ।
  • ପୂର୍ବରୁ ଥିବା ରେକର୍ଡିଂର ଉଚ୍ଚାରଣ ଏବଂ ଭାବପ୍ରବଣ ସ୍ବରକୁ ମଧ୍ୟ ପରିବର୍ତ୍ତନ କରିପାରିବ । ଅର୍ଥାତ ଆପଣ କିଛି ଲେଖା ଦେଲେ ଏହା ତାହାକୁ ରାଗିବା ଓ ଶାନ୍ତ ସ୍ବରରେ ଏକ ଅଡିଓ ଜେନେରେଟ୍‌ କରିଦେବ ।
  • ଏକ ବିଜ୍ଞାପନ ଏଜେନ୍ସି ଏହାକୁ ଭଏସ୍ ଓଭରରେ ବିଭିନ୍ନ ଉଚ୍ଚାରଣ ଏବଂ ଭାବନା ପ୍ରୟୋଗ କରି ଏକାଧିକ ଭାଷାଭାଷୀ ଅଞ୍ଚଳ ପାଇଁ ବିଜ୍ଞାପନ ପ୍ରସ୍ତୁତ କରିବାରେ ବ୍ୟବହାର କରିପାରିବେ ।
ଏହା ବି ପଢନ୍ତୁ
  1. Appleକୁ ପଛରେ ଛାଡ଼ିଲା Nvidia; AI ଯୁଗରେ ହେଲା ବିଶ୍ବର ବୃହତ୍ତମ କମ୍ପାନୀ
  2. Googleକୁ ପୁଣି ଚିନ୍ତାରେ ପକାଇଲା OpenAI; ସର୍ଚ୍ଚ ଇଞ୍ଜିନ ପରେ ଆଣୁଛି Browser

ରିଲିଜ ହେବ କି ଏହି ଟୁଲ୍‌ ?

ଜେନେରେଟିଭ୍ ଏଆଇ ମଡେଲଗୁଡିକ ରିଲିଜ ଏକ ବିବାଦୀୟ ବିଷୟ ହୋଇପଡ଼ିଛି । ବିଶେଷକରି ମନୋରଞ୍ଜନ କ୍ଷେତ୍ରରେ ଯେଉଁଠାରେ କପିରାଇଟ୍ ଏବଂ ଭଏସ୍ ଅନୁକରଣ ପ୍ରସଙ୍ଗ ଆଦି ରହିଛି ସେଠାରେ ଏପରି ଟୁଲ୍‌ର ବ୍ୟବହାର ସମସ୍ୟା ସୃଷ୍ଟି କରିପାରେ । ଅପବ୍ୟବହାର ଓ କପିରାଇଟ୍ ଉଲ୍ଲଂଘନ ନେଇ ସମ୍ଭାବ୍ୟ ଯୋଗୁଁ ଏହାକୁ ସାର୍ବଜନୀନ କରିବା ବିପଦପୂର୍ଣ୍ଣ ହୋଇପାରେ ବୋଲି ଏନଭିଡିଆ କହିଛି ।

AI model Fugatto
ନିର୍ଦ୍ଦେଶ ଅନୁସାରେ ଶାନ୍ତ ସ୍ବର ତିଆରି କରୁଛି 'ଫୁଗାଟୋ' (Credit- NVIDIA)

ସାର୍ବଜନୀନ ପାଇଁ କୁଣ୍ଠିତ Nvidia ?

ଏହି ଏଆଇ ଟୁଲ୍‌ଟି ଭାରତ, ବ୍ରାଜିଲ, ଚୀନ, ଜୋର୍ଡାନ ଏବଂ ଦକ୍ଷିଣ କୋରିଆ ସମେତ ବିଶ୍ବର ବିଭିନ୍ନ ଲୋକଙ୍କ ଦ୍ବାରା ପ୍ରସ୍ତୁତ କରାଯାଇଥିଲା । Nvidia ଦାବି କରିଛି ଯେ ଏହା Fugattoର ଏକାଧିକ ଉଚ୍ଚାରଣ ଏବଂ ବହୁଭାଷୀ କ୍ଷମତାକୁ ଅଧିକ ଶକ୍ତିଶାଳୀ କରିଛି । ୟୁଜରଙ୍କ ନିର୍ଦ୍ଦେଶନାମାକୁ ମିଶ୍ରଣ କରିବା ପାଇଁ ମଡେଲ୍ କମ୍ପୋଜେବଲ୍ ଆର୍ଟ (ComposableART) ନାମକ ଏକ ଟେକିନିକ୍‌ର ବ୍ୟବହାର କରାଯାଇଛି । ଉଦାହରଣ ସ୍ବରୂପ, ୟୁଜର କିଛି ଲେଖା ଦେଇ ଫ୍ରେଞ୍ଚ ଉଚ୍ଚାରଣ ଶୈଳୀରେ ଏହାର ସ୍ବର ମାଗିପାରେ । ଏହି ଟୁଲ୍‌ ସଙ୍ଗେ ସଙ୍ଗେ ଉକ୍ତ ଲେଖା ସହିତ ଏକ ଫ୍ରେଞ୍ଚ ସ୍ବର ସହିତ ଅଡିଓ ପଠାଇପାରିବ । ଏହାକୁ ସଠିକ ଦିଗରେ ବ୍ୟବହାର କଲେ ଏହା ନିଶ୍ଚିତ ବେଶ ଉପକାରୀ । କିନ୍ତୁ ସମ୍ପ୍ରତି ଏହାକୁ ଅସାଧୁ ଉପାୟରେ ବ୍ୟବହାର କରିବାର ଅଧିକ ସମ୍ଭାବନା ରହିଛି । ଏଣୁ କମ୍ପାନୀ ଏହି ଟୁଲ୍‌କୁ ସାର୍ବଜନୀନ କରିବା ଦିଗରେ କୁଣ୍ଠାବୋଧ କରିଛି ।

ETV Bharat Logo

Copyright © 2024 Ushodaya Enterprises Pvt. Ltd., All Rights Reserved.