वॉयस प्रबंधन

यह मॉड्यूल आपके गेम और कथात्मक प्रोजेक्ट्स में वॉयस नरेशन के इंटीग्रेशन को प्रबंधित करने की अनुमति देता है।
आपके प्रोजेक्ट की प्रत्येक कुंजी के लिए, आप एक संबंधित वॉयस संस्करण बना और संबद्ध कर सकते हैं।
इस पृष्ठ के पूरक के रूप में आपको एक पूर्ण गाइड यहां मिलेगा।

यह कैसे काम करता है?

LSDE दो दृष्टिकोणों का समर्थन करता है, जिन्हें SAD और MAD के रूप में संक्षिप्त किया गया है।

SAD: "सिंगल एक्टर डायलॉग"
इस प्रतिमान में, आप मैन्युअल रूप से मेटाडेटा के माध्यम से प्रत्येक डायलॉग कुंजी के लिए एक विशिष्ट वार्ताकार को संबद्ध कर सकते हैं।

यद्यपि SAD मोड मुख्य रूप से प्रति कुंजी एक एक्टर के लिए डिज़ाइन किया गया है, लेकिन मेटाडेटा के माध्यम से एक ही कुंजी के साथ कई वॉयस प्रोफाइल को संबद्ध करना संभव है, उदाहरण के लिए सामान्य संदेशों के लिए जिन्हें विभिन्न स्वर या आवाज़ों की आवश्यकता होती है।
दो अलग-अलग कुंजियों के साथ SAD मोड में प्रबंधित डायलॉग का उदाहरण:
textsalut ca va ?
textoui ca va super

MAD: "मल्टी एक्टर डायलॉग"
इस प्रतिमान में, कई वार्ताकार एक ही डायलॉग कुंजी के भीतर हस्तक्षेप कर सकते हैं।
उनकी पंक्तियाँ विशिष्ट टैग द्वारा पहचानी जाती हैं जो टेक्स्ट को विभाजित करते हैं।
हस्तक्षेप का क्रम अनुक्रमिक होता है।
पात्रों के पहचानकर्ताओं और उनके संबंधित टेक्स्ट को निकालने के लिए, आपको एक नियमित अभिव्यक्ति (regex) को परिभाषित करना होगा।

कुछ जटिल प्रोजेक्ट्स में, कई डायलॉग्स को एक ही कुंजी में समूहित करना और पोस्ट-प्रोडक्शन में, सीधे गेम इंजन में उनके अलगाव का प्रबंधन करना बुद्धिमानी हो सकती है।
MAD डायलॉग का उदाहरण:

doc-lsde-features-howtorendering-0-animate

text{lia} salut ca va ?
{boo} oui ca va super
{lia} Ho !
{boo} quoi !? pourquoi cette tete ?
{lia} ...
{sam} ...<br/>hey vous 2 !

यह विधि प्रबंधित की जाने वाली कुंजियों की संख्या को काफी कम कर देती है।
उपरोक्त उदाहरण के लिए, जहाँ प्रत्येक पंक्ति की अपनी कुंजी होगी, और 10 भाषाओं में अनुवाद के साथ, यह 60 से अधिक कुंजियों का प्रतिनिधित्व करेगा।
इस प्रकार की सैकड़ों इंटरैक्शन वाले आरपीजी के लिए प्रत्येक हस्तक्षेप को व्यक्तिगत रूप से प्रबंधित करना तेजी से असहनीय हो जाएगा।

पूर्व-आवश्यकताएँ

आवाज़ें उत्पन्न करने के लिए, आपके पास ElevenLabs का एक खाता और एक API कुंजी होनी चाहिए।

ElevenLabs मासिक क्रेडिट कोटा के साथ एक निःशुल्क API कुंजी प्रदान करता है, जिससे आप उनकी तकनीक का परीक्षण कर सकते हैं।

इंटरफ़ेस

इंटरफ़ेस भाषाओं की एक सूची, चरित्र प्रोफाइल, वॉयस जनरेशन टूल और बनाई गई आवाज़ों का इतिहास प्रदर्शित करता है।

इतिहास
चयनित कुंजी के लिए बनाए गए सभी ऑडियो इंस्टेंस की सूची।

भाषा कंटेनर
ये टैब भाषाओं के अनुसार पात्रों को समूहित करते हैं।

वार्ताकार कंटेनर
उन संस्थाओं (पात्रों) की सूची जिन्हें वॉयस नरेशन असाइन किया जा सकता है। \\MAD\\ मोड में, उनका क्रम स्रोत टेक्स्ट में उनकी उपस्थिति के अनुरूप होता है।

टेक्स्ट
उत्पन्न वॉयस नरेशन के लिए आधार के रूप में कार्य करने वाला कैप्चर किया गया टेक्स्ट। आवाज़ को प्रभावित करने के लिए इसमें विराम चिह्न को संशोधित करने या भावनाओं के संकेत जोड़ने की सलाह दी जाती है, बिना मूल स्रोत टेक्स्ट को बदले। यदि स्रोत टेक्स्ट संशोधित किया जाता है तो आपको एक अलर्ट दिखाया जाएगा।

सुधार
यह बटन कुंजी के मेटाडेटा में परिभाषित चरित्र की व्यक्तित्व और संदर्भ के आधार पर वॉयस नरेशन के लिए टेक्स्ट को बेहतर बनाने की अनुमति देता है।

यह फ़ंक्शन केवल ElevenLabs के V3 मॉडलों के लिए उपलब्ध है।

जनरेटर
यह बटन एक आवाज़ उत्पन्न करता है और इसे इतिहास में जोड़ता है।

रीसेट करें
यह बटन टेक्स्ट में किए गए संशोधनों को रद्द करता है और कैप्चर किए गए मूल संस्करण को पुनर्स्थापित करता है।

एक आवाज़ को मान्य करें
एक आवाज़ को मान्य करने की अनुमति देता है।
मान्य की गई आवाज़ें इतिहास से स्वतंत्र रूप से रखी जाती हैं और प्रोजेक्ट को सहेजते समय परिभाषित मानदंडों के अनुसार निर्यात की जाएंगी।

एक ही टेक्स्ट और एक ही चरित्र के लिए कई आवाज़ों को मान्य करना संभव है।
तब फ़ाइल नाम स्वचालित रूप से बढ़ाए जाएंगे।
यह उपयोगी हो सकता है, उदाहरण के लिए, यादृच्छिक बीज (random seeds) का उपयोग करने वाले गेम इंजन में आवाज़ों को सूक्ष्मता से व्यक्त करने के लिए।

जनरेशन हस्ताक्षर
जनरेशन के दौरान उपयोग की गई यह जानकारी, प्रत्येक आवाज़ के मूल को ट्रैक करने और समझने के लिए एक हस्ताक्षर के रूप में कार्य करती है।

उदाहरण के लिए, यदि आप एक नया चरित्र जोड़ते हैं या उसे स्रोत टेक्स्ट में ले जाते हैं, तो आप मौजूदा आवाज़ों को इकाई को फिर से असाइन कर पाएंगे, भले ही उसका स्थान बदल गया हो।

ऑडियो प्लेयर
आवाज़ के प्लेबैक को शुरू करने और उसके पिच को देखने की अनुमति देता है ताकि इसे वांछित सामान्य परिवेश से तुलना की जा सके।

आवाज़ें बनाएँ

SAD के साथ

आपको कम से कम एक वॉयस प्रोफाइल कॉन्फ़िगर करना होगा और प्रोजेक्ट सेटिंग्स में वॉयस मैनेजर को सक्रिय करना होगा।
कुंजी से जुड़े एक्टर (या संस्थाओं) और उनके वॉयस प्रोफाइल का कॉन्फ़िगरेशन मेटाडेटा विंडो में किया जाता है।

MAD के साथ

आपको कम से कम एक वॉयस प्रोफाइल कॉन्फ़िगर करना होगा और प्रोजेक्ट सेटिंग्स में वॉयस मैनेजर को सक्रिय करना होगा।
फिर MAD मोड को सक्रिय करें और नियमित अभिव्यक्ति (regex) लिखें।
इसे दो अनिवार्य समूहों को कैप्चर करना होगा: एक्टर का पहचानकर्ता और उसका संबंधित टेक्स्ट।
इन कैप्चर समूहों का इंडेक्स वॉयस एसोसिएशन सेटिंग्स में परिभाषित करें।

doc-lsde-ui-voicereorder

समस्याओं को ठीक करें

टेक्स्ट को अंतिम रूप देने से पहले आवाज़ें उत्पन्न करना एक ऐसी प्रथा है जिससे बचना चाहिए।
हालांकि, यदि ऐसा होता है, तो LSDE आपको आवाज़ों को ठीक करने और पुनर्व्यवस्थित करने के लिए उपकरण प्रदान करता है, जिससे सब कुछ फिर से करने से बचा जा सकता है।
जब आप आवाज़ें उत्पन्न होने के बाद डायलॉग के टेक्स्ट को संशोधित करते हैं, तो उनका हस्ताक्षर असंगत हो जाता है, और आपको उन्हें फिर से मान्य करने के लिए कहा जाएगा।
MAD मोड में, यदि आप पात्रों को स्थानांतरित करते हैं, जोड़ते हैं या हटाते हैं, तो आपको पहले से उत्पन्न वॉयस इंस्टेंस को भी फिर से असाइन करना होगा।

पुन: असाइनमेंट प्रोजेक्ट की मूल भाषा में किया जाता है; अन्य भाषाओं को उनके मूल हस्ताक्षर के कारण स्वचालित रूप से पुनर्व्यवस्थित किया जाएगा।

पूर्ण गाइड यहां प्राप्त करें।