ボイス管理

このモジュールは、ゲームや物語プロジェクトに音声ナレーションを統合することを可能にします。


プロジェクトの各キーに対して、対応する音声バージョンを生成し、関連付けることができます。


このページに加えて、

完全なガイドはこちら

でご覧いただけます。



仕組み

LSDE

は、

SAD

MAD

の2つのアプローチをサポートしています。


SAD:「シングルアクターダイアログ」


このパラダイムでは、メタデータを通じて、各ダイアログキーに特定の話し手を手動で関連付けることができます。


SADモードは主に1つのキーにつき1人のアクターを想定していますが、例えば異なるイントネーションや声が必要な汎用メッセージの場合など、メタデータを通じて同じキーに複数の音声プロファイルを関連付けることも可能です。


2つの異なるキーで

SAD

モードで管理されるダイアログの例:


text
こんにちは、元気?

text
うん、すごく元気だよ

MAD:「マルチアクターダイアログ」


このパラダイムでは、複数の話し手が同じダイアログキー内で発言できます。彼らのセリフは、テキストを区切る特定のタグによって識別されます。発言の順序はシーケンシャルです。


キャラクターの識別子とそれに関連するテキストを抽出するには、正規表現(regex)を定義する必要があります。


一部の複雑なプロジェクトでは、複数のダイアログを1つのキーにまとめ、ゲームエンジン内で直接ポストプロダクションで分割を管理することが賢明な場合があります。


MAD

ダイアログの例:

doc-lsde-features-howtorendering-0-animate
text
{lia} こんにちは、元気?
{boo} うん、すごく元気だよ
{lia} あっ!
{boo} 何!?なんでそんな顔してるの?
{lia} ...
{sam} ... おい、君たち二人!

この方法は、管理するキーの数を大幅に削減します。


上記の例では、各セリフが独自のキーを持ち、10ヶ国語に翻訳されると、60以上のキーに相当します。


このようなインタラクションが数百もあるRPGの場合、各発言を個別に管理することはすぐに手に負えなくなります。


前提条件

音声を生成するには、

ElevenLabs

のアカウントとAPIキーが必要です。


ElevenLabsは、月間クレジット枠付きの無料APIキーを提供しており、その技術を試すことができます。

doc-lsde-ui-voicemanager

インターフェース

このインターフェースには、言語リスト、キャラクタープロファイル、音声生成ツール、および作成された音声の履歴が表示されます。


履歴


選択されたキー用に作成されたすべてのオーディオインスタンスのリスト。

言語コンテナ


これらのタブは、言語ごとにキャラクターをグループ化します。

話し手コンテナ


音声ナレーションを割り当てることができるエンティティ(キャラクター)のリスト。


「MAD」モードでは、その順序はソーステキストに登場する順序に対応します。

テキスト


生成される音声ナレーションの基礎となる、キャプチャされたテキスト。句読点を変更したり、感情の指示を追加したりして、元のソーステキストを変更することなく、声に影響を与えることをお勧めします。


ソーステキストが変更された場合、アラートが表示されます。

強化


このボタンは、キャラクターの個性とキーのメタデータで定義されたコンテキストに基づいて、音声ナレーション用のテキストを改善します。


この機能はElevenLabsのV3モデルでのみ利用可能です。

ジェネレーター


このボタンは音声を生成し、履歴に追加します。

リセット


このボタンは、テキストに加えられた変更をキャンセルし、キャプチャされた元のバージョンを復元します。

音声の検証


音声を検証することを可能にします。検証された音声は履歴とは別に保存され、プロジェクトの保存時に定義された基準に従ってエクスポートされます。


同じテキストと同じキャラクターに対して複数の音声を検証することが可能です。ファイル名は自動的にインクリメントされます。


これは、例えば、ランダムシードを使用するゲームエンジンで音声にニュアンスを加えるのに役立つ場合があります。

生成署名


生成時に使用されるこれらの情報は、各音声の起源を追跡し理解するための署名として機能します。


例えば、新しいキャラクターを追加したり、ソーステキスト内で移動したりした場合でも、そのエンティティの位置が変わっても、既存の音声を再割り当てすることができます。

オーディオプレイヤー


音声の再生を開始し、ピッチを視覚化して、希望する全体的な雰囲気と比較することを可能にします。


音声を作成する

SADを使用する

プロジェクト設定で、少なくとも1つの音声プロファイルを構成し、音声マネージャーを有効にする必要があります。


キーに関連付けられたアクター(またはエンティティ)とそれらの音声プロファイルの設定は、メタデータウィンドウで行われます。


MADを使用する

プロジェクト設定で、少なくとも1つの音声プロファイルを構成し、音声マネージャーを有効にする必要があります。


次に、「MAD」モードを有効にし、正規表現(regex)を作成します。これは、アクターの識別子とその対応するテキストという2つの必須グループをキャプチャする必要があります。


これらのキャプチャグループのインデックスを音声関連付け設定で定義します。


doc-lsde-ui-voicereorder

問題を修正する

テキストの最終化前に音声を生成することは避けるべき習慣です。


しかし、そのような事態が発生した場合でも、

LSDE

は音声を修正し再編成するためのツールを提供し、すべてをやり直す手間を省きます。


音声が生成された後にダイアログのテキストを変更すると、その署名が互換性のないものになり、再検証を求められます。


MAD

モードでキャラクターを移動、追加、または削除した場合、既に生成された音声インスタンスも再割り当てする必要があります。


再割り当てはプロジェクトのネイティブ言語で行われます。他の言語は、元の署名に基づいて自動的に再編成されます。


完全なガイドはこちら

でご覧いただけます。