सैन फ्रांसिस्को : माइक्रोसॉफ्ट ने विजन क्षमताओं के साथ एक नया टेक्स्ट-टू-स्पीच फीचर पेश किया है, जो उपयोगकर्ताओं को टेक्स्ट इनपुट के साथ टॉकिंग अवतार वीडियो बनाने और मानव छवियों का उपयोग करके प्रशिक्षित वास्तविक समय इंटरैक्टिव बॉट बनाने में सक्षम बनाता है. इसे एज्योर एआई स्पीच टेक्स्ट कहा जाता है और यह सार्वजनिक पूर्वावलोकन में उपलब्ध है, यह ग्राहकों को 2डी फोटोरियलिस्टिक अवतार में बोलते हुए सिंथेटिक वीडियो बनाने की अनुमति देता है.
-
Microsoft has introduced two AI tools: the Azure AI Speech text-to-speech avatar, which generates photorealistic avatars and animates them speaking based on a script, and the Personal Voice synthesis tool, which replicates a user's voice using a one-minute speech sample. pic.twitter.com/x5lmqMcBUY
— Broadcast Republic (@BcastRepublic) November 15, 2023 " class="align-text-top noRightClick twitterSection" data="
">Microsoft has introduced two AI tools: the Azure AI Speech text-to-speech avatar, which generates photorealistic avatars and animates them speaking based on a script, and the Personal Voice synthesis tool, which replicates a user's voice using a one-minute speech sample. pic.twitter.com/x5lmqMcBUY
— Broadcast Republic (@BcastRepublic) November 15, 2023Microsoft has introduced two AI tools: the Azure AI Speech text-to-speech avatar, which generates photorealistic avatars and animates them speaking based on a script, and the Personal Voice synthesis tool, which replicates a user's voice using a one-minute speech sample. pic.twitter.com/x5lmqMcBUY
— Broadcast Republic (@BcastRepublic) November 15, 2023
कंपनी ने बुधवार देर रात Microsoft ignite इवेंट के दौरान कहा, "न्यूरल टेक्स्ट टू स्पीच अवतार मॉडल को मानव वीडियो रिकॉर्डिंग नमूनों के आधार पर गहरे तंत्रिका नेटवर्क द्वारा प्रशिक्षित किया जाता है, और अवतार की आवाज टेक्स्ट टू स्पीच वॉयस मॉडल द्वारा प्रदान की जाती है." Microsoft text to speech avatar के साथ, यूजर अधिक आकर्षक डिजिटल इंटरैक्शन बना सकते हैं. वे संवादी एजेंट, आभासी सहायक, चैटबॉट और बहुत कुछ बनाने के लिए अवतार का उपयोग कर सकते हैं.
Text-to-speech avatar को व्यक्तियों और समाज के अधिकारों की रक्षा करने, पारदर्शी मानव-कंप्यूटर संपर्क को बढ़ावा देने और हानिकारक डीपफेक और भ्रामक सामग्री के प्रसार का प्रतिकार करने के इरादे से डिज़ाइन किया गया है. कंपनी ने कहा,“इस कारण से, कस्टम अवतार एक सीमित एक्सेस सुविधा है जो केवल पंजीकरण द्वारा और केवल कुछ उपयोग के मामलों के लिए उपलब्ध है. अपने व्यावसायिक अनुप्रयोगों में सुविधा तक पहुंचने और उपयोग करने के लिए, अपना उपयोग मामला यहां पंजीकृत करें और पहुंच के लिए आवेदन करें.”
कंपनी इस समय दो अलग-अलग टेक्स्ट टू स्पीच अवतार फीचर पेश कर रही है: प्रीबिल्ट Text to speech avatar और कस्टम टेक्स्ट टू स्पीच अवतार. कंपनी ने कहा, “माइक्रोसाॅफ्ट अपने ग्राहकों के लिए एज्योर पर आउट-ऑफ़-बॉक्स उत्पादों के रूप में प्रीबिल्ट टेक्स्ट टू स्पीच अवतार प्रदान करता है. ये अवतार टेक्स्ट इनपुट के आधार पर विभिन्न भाषाएं और आवाजें बोल सकते हैं. ग्राहक विभिन्न विकल्पों में से एक अवतार का चयन कर सकते हैं और इसका उपयोग वास्तविक समय अवतार प्रतिक्रियाओं के साथ वीडियो सामग्री या इंटरैक्टिव एप्लिकेशन बनाने के लिए कर सकते हैं.”