BR-TTSの画面構成です。
使用方法

- ECAPA-TDNN手法を採用しています。NeuralNetwork方式と比べ、処理時間は格段に速いです。
- 完全オフライン動作です。
- 画面の上から順に操作していきますと再生音を得られます。
- ユーザ様の作業は、①metadata.csv(wavデータの名前と対応します文言のデータ)に即した音声録音、②再生したい音声のtextデータです。
- metadata.csv作成時、不明の場合は作成をお手伝いします(初回は無償)。
- バリエーションパラメータとして、random seed(乱数生成の初期値), temperature(確率分布の鋭さを制御)を使用しています。
- 再生音は候補に挙がった音声の中から、ご自分の気に入った音声を選択願います。
[再生音のサンプル]
- 録音学習サンプルの120文(単語、文章)の録音から学習しました(平均録音品質: 71.8%)。
