Управление голосом

Этот модуль позволяет управлять интеграцией голосового сопровождения в ваших играх и нарративных проектах.
Для каждого ключа вашего проекта вы можете сгенерировать и связать соответствующую голосовую версию.
Полное руководство можно найти здесь в дополнение к этой странице.

Как это работает?#

LSDE поддерживает два подхода, сокращенно SAD и MAD.

SAD : «Диалог с одним актером»
В этой парадигме вы можете вручную связать конкретного собеседника с каждым ключом диалога через его метаданные.

Хотя режим SAD в основном предназначен для одного актера на ключ, можно связать несколько голосовых профилей с одним и тем же ключом через метаданные, например, для общих сообщений, требующих различных интонаций или голосов.
Пример диалога, управляемого в режиме SAD с двумя отдельными ключами:
textsalut ca va ?
textoui ca va super

MAD : «Диалог с несколькими актерами»
В этой парадигме несколько собеседников могут участвовать в одном ключе диалога.
Их реплики идентифицируются специальными тегами, которые сегментируют текст.
Порядок реплик последовательный.
Для извлечения идентификаторов персонажей и связанных с ними текстов необходимо определить регулярное выражение (regex).

В некоторых сложных проектах может быть целесообразно сгруппировать несколько диалогов в один ключ и управлять их разделением на этапе постпродакшна, непосредственно в игровом движке.
Пример для диалога MAD:

doc-lsde-features-howtorendering-0-animate

text{lia} salut ca va ?
{boo} oui ca va super
{lia} Ho !
{boo} quoi !? pourquoi cette tete ?
{lia} ...
{sam} ...<br/>hey vous 2 !

Этот метод значительно сокращает количество ключей, которыми нужно управлять.
В приведенном выше примере, где каждая реплика имела бы свой собственный ключ, и с переводом на 10 языков, это составило бы более 60 ключей.
Управление каждым вмешательством по отдельности быстро стало бы неуправляемым для RPG, содержащей сотни подобных взаимодействий.

Предварительные требования#

Для генерации голосов вам необходим аккаунт и ключ API ElevenLabs.

ElevenLabs предлагает бесплатный ключ API с ежемесячным лимитом кредитов, что позволяет вам протестировать их технологию.

Интерфейс#

Интерфейс отображает список языков, профили персонажей, инструменты генерации голоса и историю созданных голосов.

История
Список всех аудио-экземпляров, созданных для выбранного ключа.

Контейнер языка
Эти вкладки группируют персонажей по языкам.

Контейнер собеседников
Список сущностей (персонажей), которым может быть присвоено голосовое сопровождение. В режиме \\MAD\\ их порядок соответствует порядку их появления в исходном тексте.

Текст
Захваченный текст служит основой для сгенерированного голосового сопровождения. Рекомендуется изменять пунктуацию или добавлять указания на эмоции, чтобы повлиять на голос, не изменяя при этом исходный текст. Предупреждение будет отображено, если исходный текст будет изменен.

Улучшение
Эта кнопка позволяет улучшить текст, предназначенный для голосового сопровождения, на основе личности персонажа и контекста, определенных в метаданных ключа.

Эта функция доступна только для моделей ElevenLabs V3.

Генератор
Эта кнопка генерирует голос и добавляет его в историю.

Сбросить
Эта кнопка отменяет изменения, внесенные в текст, и восстанавливает исходную захваченную версию.

Подтвердить голос
Позволяет подтвердить голос.
Подтвержденные голоса сохраняются независимо от истории и будут экспортированы в соответствии с критериями, определенными при сохранении проекта.

Можно подтвердить несколько голосов для одного и того же текста и персонажа.
Имена файлов будут автоматически инкрементироваться.
Это может быть полезно, например, для придания нюансов голосам в игровом движке, использующем случайные затравки (random seeds).

Подпись генерации
Эта информация, используемая при генерации, служит подписью для отслеживания и понимания происхождения каждого голоса.

Например, если вы добавите нового персонажа или переместите его в исходном тексте, вы сможете переназначить существующие голоса сущности, даже если ее местоположение изменилось.

Аудиоплеер
Позволяет запустить воспроизведение голоса и визуализировать его высоту (pitch), чтобы сравнить ее с желаемой общей атмосферой.

Создание голосов#

С использованием SAD#

Вы должны настроить как минимум один голосовой профиль и активировать менеджер голосов в настройках проекта.
Настройка актеров (или сущностей), связанных с ключом, и их голосовых профилей осуществляется в окне метаданных.

С использованием MAD#

Вы должны настроить как минимум один голосовой профиль и активировать менеджер голосов в настройках проекта.
Затем активируйте режим MAD и напишите регулярное выражение (regex).
Оно должно захватывать две обязательные группы: идентификатор актера и соответствующий ему текст.
Определите индекс этих групп захвата в настройках голосовой ассоциации.
doc-lsde-ui-voicereorder

Исправление проблем#

Генерация голосов до завершения работы над текстом — это практика, которой следует избегать.
Однако, если это произойдет, LSDE предлагает инструменты для исправления и реорганизации голосов, что позволяет избежать повторной работы.
При изменении текста диалога после генерации голосов их подпись становится несовместимой, и вам будет предложено повторно подтвердить их.
В режиме MAD, если вы перемещаете, добавляете или удаляете персонажей, вам также потребуется переназначить уже сгенерированные голосовые экземпляры.

Переназначение осуществляется на родном языке проекта; другие языки будут автоматически реорганизованы благодаря их исходной подписи.

Полное руководство можно найти здесь.

Управление голосом

Как это работает?

Предварительные требования