वॉयस प्रबंधन
यह मॉड्यूल आपके गेम और कथात्मक प्रोजेक्ट्स में वॉयस नरेशन के इंटीग्रेशन को प्रबंधित करने की अनुमति देता है।
आपके प्रोजेक्ट की प्रत्येक कुंजी के लिए, आप एक संबंधित वॉयस संस्करण बना और संबद्ध कर सकते हैं।
इस पृष्ठ के पूरक के रूप में आपको
एक पूर्ण गाइड यहां
मिलेगा।
यह कैसे काम करता है?
LSDE
दो दृष्टिकोणों का समर्थन करता है, जिन्हें
SADऔर
MADके रूप में संक्षिप्त किया गया है।
SAD: "सिंगल एक्टर डायलॉग"
इस प्रतिमान में, आप मैन्युअल रूप से मेटाडेटा के माध्यम से प्रत्येक डायलॉग कुंजी के लिए एक विशिष्ट वार्ताकार को संबद्ध कर सकते हैं।
यद्यपि SAD मोड मुख्य रूप से प्रति कुंजी एक एक्टर के लिए डिज़ाइन किया गया है, लेकिन मेटाडेटा के माध्यम से एक ही कुंजी के साथ कई वॉयस प्रोफाइल को संबद्ध करना संभव है, उदाहरण के लिए सामान्य संदेशों के लिए जिन्हें विभिन्न स्वर या आवाज़ों की आवश्यकता होती है।
दो अलग-अलग कुंजियों के साथ
SAD
मोड में प्रबंधित डायलॉग का उदाहरण:
textsalut ca va ?textoui ca va super
MAD: "मल्टी एक्टर डायलॉग"
इस प्रतिमान में, कई वार्ताकार एक ही डायलॉग कुंजी के भीतर हस्तक्षेप कर सकते हैं।
उनकी पंक्तियाँ विशिष्ट टैग द्वारा पहचानी जाती हैं जो टेक्स्ट को विभाजित करते हैं।
हस्तक्षेप का क्रम अनुक्रमिक होता है।
पात्रों के पहचानकर्ताओं और उनके संबंधित टेक्स्ट को निकालने के लिए, आपको एक नियमित अभिव्यक्ति (regex) को परिभाषित करना होगा।
कुछ जटिल प्रोजेक्ट्स में, कई डायलॉग्स को एक ही कुंजी में समूहित करना और पोस्ट-प्रोडक्शन में, सीधे गेम इंजन में उनके अलगाव का प्रबंधन करना बुद्धिमानी हो सकती है।
MAD
डायलॉग का उदाहरण:

text{lia} salut ca va ? {boo} oui ca va super {lia} Ho ! {boo} quoi !? pourquoi cette tete ? {lia} ... {sam} ...<br/>hey vous 2 !
यह विधि प्रबंधित की जाने वाली कुंजियों की संख्या को काफी कम कर देती है।
उपरोक्त उदाहरण के लिए, जहाँ प्रत्येक पंक्ति की अपनी कुंजी होगी, और 10 भाषाओं में अनुवाद के साथ, यह 60 से अधिक कुंजियों का प्रतिनिधित्व करेगा।
इस प्रकार की सैकड़ों इंटरैक्शन वाले आरपीजी के लिए प्रत्येक हस्तक्षेप को व्यक्तिगत रूप से प्रबंधित करना तेजी से असहनीय हो जाएगा।
पूर्व-आवश्यकताएँ
आवाज़ें उत्पन्न करने के लिए, आपके पास
ElevenLabs
का एक खाता और एक API कुंजी होनी चाहिए।
ElevenLabs मासिक क्रेडिट कोटा के साथ एक निःशुल्क API कुंजी प्रदान करता है, जिससे आप उनकी तकनीक का परीक्षण कर सकते हैं।

इंटरफ़ेस
इंटरफ़ेस भाषाओं की एक सूची, चरित्र प्रोफाइल, वॉयस जनरेशन टूल और बनाई गई आवाज़ों का इतिहास प्रदर्शित करता है।
इतिहास
चयनित कुंजी के लिए बनाए गए सभी ऑडियो इंस्टेंस की सूची।
भाषा कंटेनर
ये टैब भाषाओं के अनुसार पात्रों को समूहित करते हैं।
वार्ताकार कंटेनर
उन संस्थाओं (पात्रों) की सूची जिन्हें वॉयस नरेशन असाइन किया जा सकता है। \\MAD\\ मोड में, उनका क्रम स्रोत टेक्स्ट में उनकी उपस्थिति के अनुरूप होता है।
टेक्स्ट
उत्पन्न वॉयस नरेशन के लिए आधार के रूप में कार्य करने वाला कैप्चर किया गया टेक्स्ट। आवाज़ को प्रभावित करने के लिए इसमें विराम चिह्न को संशोधित करने या भावनाओं के संकेत जोड़ने की सलाह दी जाती है, बिना मूल स्रोत टेक्स्ट को बदले। यदि स्रोत टेक्स्ट संशोधित किया जाता है तो आपको एक अलर्ट दिखाया जाएगा।
सुधार
यह बटन कुंजी के मेटाडेटा में परिभाषित चरित्र की व्यक्तित्व और संदर्भ के आधार पर वॉयस नरेशन के लिए टेक्स्ट को बेहतर बनाने की अनुमति देता है।
यह फ़ंक्शन केवल ElevenLabs के V3 मॉडलों के लिए उपलब्ध है।
जनरेटर
यह बटन एक आवाज़ उत्पन्न करता है और इसे इतिहास में जोड़ता है।
रीसेट करें
यह बटन टेक्स्ट में किए गए संशोधनों को रद्द करता है और कैप्चर किए गए मूल संस्करण को पुनर्स्थापित करता है।
एक आवाज़ को मान्य करें
एक आवाज़ को मान्य करने की अनुमति देता है।
मान्य की गई आवाज़ें इतिहास से स्वतंत्र रूप से रखी जाती हैं और प्रोजेक्ट को सहेजते समय परिभाषित मानदंडों के अनुसार निर्यात की जाएंगी।
एक ही टेक्स्ट और एक ही चरित्र के लिए कई आवाज़ों को मान्य करना संभव है।
तब फ़ाइल नाम स्वचालित रूप से बढ़ाए जाएंगे।
यह उपयोगी हो सकता है, उदाहरण के लिए, यादृच्छिक बीज (random seeds) का उपयोग करने वाले गेम इंजन में आवाज़ों को सूक्ष्मता से व्यक्त करने के लिए।
जनरेशन हस्ताक्षर
जनरेशन के दौरान उपयोग की गई यह जानकारी, प्रत्येक आवाज़ के मूल को ट्रैक करने और समझने के लिए एक हस्ताक्षर के रूप में कार्य करती है।
उदाहरण के लिए, यदि आप एक नया चरित्र जोड़ते हैं या उसे स्रोत टेक्स्ट में ले जाते हैं, तो आप मौजूदा आवाज़ों को इकाई को फिर से असाइन कर पाएंगे, भले ही उसका स्थान बदल गया हो।
ऑडियो प्लेयर
आवाज़ के प्लेबैक को शुरू करने और उसके पिच को देखने की अनुमति देता है ताकि इसे वांछित सामान्य परिवेश से तुलना की जा सके।
आवाज़ें बनाएँ
SAD के साथ
आपको कम से कम एक वॉयस प्रोफाइल कॉन्फ़िगर करना होगा और प्रोजेक्ट सेटिंग्स में वॉयस मैनेजर को सक्रिय करना होगा।
कुंजी से जुड़े एक्टर (या संस्थाओं) और उनके वॉयस प्रोफाइल का कॉन्फ़िगरेशन मेटाडेटा विंडो में किया जाता है।
MAD के साथ
आपको कम से कम एक वॉयस प्रोफाइल कॉन्फ़िगर करना होगा और प्रोजेक्ट सेटिंग्स में वॉयस मैनेजर को सक्रिय करना होगा।
फिर
MAD
मोड को सक्रिय करें और नियमित अभिव्यक्ति
(regex)
लिखें।
इसे दो अनिवार्य समूहों को कैप्चर करना होगा: एक्टर का पहचानकर्ता और उसका संबंधित टेक्स्ट।
इन कैप्चर समूहों का इंडेक्स वॉयस एसोसिएशन सेटिंग्स में परिभाषित करें।

समस्याओं को ठीक करें
टेक्स्ट को अंतिम रूप देने से पहले आवाज़ें उत्पन्न करना एक ऐसी प्रथा है जिससे बचना चाहिए।
हालांकि, यदि ऐसा होता है, तो
LSDE
आपको आवाज़ों को ठीक करने और पुनर्व्यवस्थित करने के लिए उपकरण प्रदान करता है, जिससे सब कुछ फिर से करने से बचा जा सकता है।
जब आप आवाज़ें उत्पन्न होने के बाद डायलॉग के टेक्स्ट को संशोधित करते हैं, तो उनका हस्ताक्षर असंगत हो जाता है, और आपको उन्हें फिर से मान्य करने के लिए कहा जाएगा।
MAD
मोड में, यदि आप पात्रों को स्थानांतरित करते हैं, जोड़ते हैं या हटाते हैं, तो आपको पहले से उत्पन्न वॉयस इंस्टेंस को भी फिर से असाइन करना होगा।
पुन: असाइनमेंट प्रोजेक्ट की मूल भाषा में किया जाता है; अन्य भाषाओं को उनके मूल हस्ताक्षर के कारण स्वचालित रूप से पुनर्व्यवस्थित किया जाएगा।
पूर्ण गाइड यहां
प्राप्त करें।