वॉयस प्रबंधन

यह मॉड्यूल आपके गेम और कथात्मक प्रोजेक्ट्स में वॉयस नरेशन के इंटीग्रेशन को प्रबंधित करने की अनुमति देता है।


आपके प्रोजेक्ट की प्रत्येक कुंजी के लिए, आप एक संबंधित वॉयस संस्करण बना और संबद्ध कर सकते हैं।


इस पृष्ठ के पूरक के रूप में आपको

एक पूर्ण गाइड यहां

मिलेगा।



यह कैसे काम करता है?

LSDE

दो दृष्टिकोणों का समर्थन करता है, जिन्हें

SAD

और

MAD

के रूप में संक्षिप्त किया गया है।


SAD: "सिंगल एक्टर डायलॉग"


इस प्रतिमान में, आप मैन्युअल रूप से मेटाडेटा के माध्यम से प्रत्येक डायलॉग कुंजी के लिए एक विशिष्ट वार्ताकार को संबद्ध कर सकते हैं।


यद्यपि SAD मोड मुख्य रूप से प्रति कुंजी एक एक्टर के लिए डिज़ाइन किया गया है, लेकिन मेटाडेटा के माध्यम से एक ही कुंजी के साथ कई वॉयस प्रोफाइल को संबद्ध करना संभव है, उदाहरण के लिए सामान्य संदेशों के लिए जिन्हें विभिन्न स्वर या आवाज़ों की आवश्यकता होती है।


दो अलग-अलग कुंजियों के साथ

SAD

मोड में प्रबंधित डायलॉग का उदाहरण:


text
salut ca va ?

text
oui ca va super

MAD: "मल्टी एक्टर डायलॉग"


इस प्रतिमान में, कई वार्ताकार एक ही डायलॉग कुंजी के भीतर हस्तक्षेप कर सकते हैं।


उनकी पंक्तियाँ विशिष्ट टैग द्वारा पहचानी जाती हैं जो टेक्स्ट को विभाजित करते हैं।


हस्तक्षेप का क्रम अनुक्रमिक होता है।


पात्रों के पहचानकर्ताओं और उनके संबंधित टेक्स्ट को निकालने के लिए, आपको एक नियमित अभिव्यक्ति (regex) को परिभाषित करना होगा।


कुछ जटिल प्रोजेक्ट्स में, कई डायलॉग्स को एक ही कुंजी में समूहित करना और पोस्ट-प्रोडक्शन में, सीधे गेम इंजन में उनके अलगाव का प्रबंधन करना बुद्धिमानी हो सकती है।


MAD

डायलॉग का उदाहरण:

doc-lsde-features-howtorendering-0-animate
text
{lia} salut ca va ?
{boo} oui ca va super
{lia} Ho !
{boo} quoi !? pourquoi cette tete ?
{lia} ...
{sam} ...<br/>hey vous 2 !

यह विधि प्रबंधित की जाने वाली कुंजियों की संख्या को काफी कम कर देती है।


उपरोक्त उदाहरण के लिए, जहाँ प्रत्येक पंक्ति की अपनी कुंजी होगी, और 10 भाषाओं में अनुवाद के साथ, यह 60 से अधिक कुंजियों का प्रतिनिधित्व करेगा।


इस प्रकार की सैकड़ों इंटरैक्शन वाले आरपीजी के लिए प्रत्येक हस्तक्षेप को व्यक्तिगत रूप से प्रबंधित करना तेजी से असहनीय हो जाएगा।


पूर्व-आवश्यकताएँ

आवाज़ें उत्पन्न करने के लिए, आपके पास

ElevenLabs

का एक खाता और एक API कुंजी होनी चाहिए।


ElevenLabs मासिक क्रेडिट कोटा के साथ एक निःशुल्क API कुंजी प्रदान करता है, जिससे आप उनकी तकनीक का परीक्षण कर सकते हैं।

doc-lsde-ui-voicemanager

इंटरफ़ेस

इंटरफ़ेस भाषाओं की एक सूची, चरित्र प्रोफाइल, वॉयस जनरेशन टूल और बनाई गई आवाज़ों का इतिहास प्रदर्शित करता है।


इतिहास


चयनित कुंजी के लिए बनाए गए सभी ऑडियो इंस्टेंस की सूची।

भाषा कंटेनर


ये टैब भाषाओं के अनुसार पात्रों को समूहित करते हैं।

वार्ताकार कंटेनर


उन संस्थाओं (पात्रों) की सूची जिन्हें वॉयस नरेशन असाइन किया जा सकता है। \\MAD\\ मोड में, उनका क्रम स्रोत टेक्स्ट में उनकी उपस्थिति के अनुरूप होता है।

टेक्स्ट


उत्पन्न वॉयस नरेशन के लिए आधार के रूप में कार्य करने वाला कैप्चर किया गया टेक्स्ट। आवाज़ को प्रभावित करने के लिए इसमें विराम चिह्न को संशोधित करने या भावनाओं के संकेत जोड़ने की सलाह दी जाती है, बिना मूल स्रोत टेक्स्ट को बदले। यदि स्रोत टेक्स्ट संशोधित किया जाता है तो आपको एक अलर्ट दिखाया जाएगा।

सुधार


यह बटन कुंजी के मेटाडेटा में परिभाषित चरित्र की व्यक्तित्व और संदर्भ के आधार पर वॉयस नरेशन के लिए टेक्स्ट को बेहतर बनाने की अनुमति देता है।


यह फ़ंक्शन केवल ElevenLabs के V3 मॉडलों के लिए उपलब्ध है।

जनरेटर


यह बटन एक आवाज़ उत्पन्न करता है और इसे इतिहास में जोड़ता है।

रीसेट करें


यह बटन टेक्स्ट में किए गए संशोधनों को रद्द करता है और कैप्चर किए गए मूल संस्करण को पुनर्स्थापित करता है।

एक आवाज़ को मान्य करें


एक आवाज़ को मान्य करने की अनुमति देता है।


मान्य की गई आवाज़ें इतिहास से स्वतंत्र रूप से रखी जाती हैं और प्रोजेक्ट को सहेजते समय परिभाषित मानदंडों के अनुसार निर्यात की जाएंगी।


एक ही टेक्स्ट और एक ही चरित्र के लिए कई आवाज़ों को मान्य करना संभव है।


तब फ़ाइल नाम स्वचालित रूप से बढ़ाए जाएंगे।


यह उपयोगी हो सकता है, उदाहरण के लिए, यादृच्छिक बीज (random seeds) का उपयोग करने वाले गेम इंजन में आवाज़ों को सूक्ष्मता से व्यक्त करने के लिए।

जनरेशन हस्ताक्षर


जनरेशन के दौरान उपयोग की गई यह जानकारी, प्रत्येक आवाज़ के मूल को ट्रैक करने और समझने के लिए एक हस्ताक्षर के रूप में कार्य करती है।


उदाहरण के लिए, यदि आप एक नया चरित्र जोड़ते हैं या उसे स्रोत टेक्स्ट में ले जाते हैं, तो आप मौजूदा आवाज़ों को इकाई को फिर से असाइन कर पाएंगे, भले ही उसका स्थान बदल गया हो।

ऑडियो प्लेयर


आवाज़ के प्लेबैक को शुरू करने और उसके पिच को देखने की अनुमति देता है ताकि इसे वांछित सामान्य परिवेश से तुलना की जा सके।


आवाज़ें बनाएँ

SAD के साथ

आपको कम से कम एक वॉयस प्रोफाइल कॉन्फ़िगर करना होगा और प्रोजेक्ट सेटिंग्स में वॉयस मैनेजर को सक्रिय करना होगा।


कुंजी से जुड़े एक्टर (या संस्थाओं) और उनके वॉयस प्रोफाइल का कॉन्फ़िगरेशन मेटाडेटा विंडो में किया जाता है।


MAD के साथ

आपको कम से कम एक वॉयस प्रोफाइल कॉन्फ़िगर करना होगा और प्रोजेक्ट सेटिंग्स में वॉयस मैनेजर को सक्रिय करना होगा।


फिर

MAD

मोड को सक्रिय करें और नियमित अभिव्यक्ति

(regex)

लिखें।


इसे दो अनिवार्य समूहों को कैप्चर करना होगा: एक्टर का पहचानकर्ता और उसका संबंधित टेक्स्ट।


इन कैप्चर समूहों का इंडेक्स वॉयस एसोसिएशन सेटिंग्स में परिभाषित करें।



doc-lsde-ui-voicereorder

समस्याओं को ठीक करें

टेक्स्ट को अंतिम रूप देने से पहले आवाज़ें उत्पन्न करना एक ऐसी प्रथा है जिससे बचना चाहिए।


हालांकि, यदि ऐसा होता है, तो

LSDE

आपको आवाज़ों को ठीक करने और पुनर्व्यवस्थित करने के लिए उपकरण प्रदान करता है, जिससे सब कुछ फिर से करने से बचा जा सकता है।


जब आप आवाज़ें उत्पन्न होने के बाद डायलॉग के टेक्स्ट को संशोधित करते हैं, तो उनका हस्ताक्षर असंगत हो जाता है, और आपको उन्हें फिर से मान्य करने के लिए कहा जाएगा।


MAD

मोड में, यदि आप पात्रों को स्थानांतरित करते हैं, जोड़ते हैं या हटाते हैं, तो आपको पहले से उत्पन्न वॉयस इंस्टेंस को भी फिर से असाइन करना होगा।


पुन: असाइनमेंट प्रोजेक्ट की मूल भाषा में किया जाता है; अन्य भाषाओं को उनके मूल हस्ताक्षर के कारण स्वचालित रूप से पुनर्व्यवस्थित किया जाएगा।


पूर्ण गाइड यहां

प्राप्त करें।