BR-TTSの画面構成です。

  • ECAPA-TDNN手法を採用しています。NeuralNetwork方式と比べ、処理時間は格段に速いです。
  • 完全オフライン動作です。
  • 画面の上から順に操作していきますと再生音を得られます。
  • ユーザ様の作業は、①metadata.csv(wavデータの名前と対応します文言のデータ)に即した音声録音、②再生したい音声のtextデータです。
  • metadata.csv作成時、不明の場合は作成をお手伝いします(初回は無償)。
  • バリエーションパラメータとして、random seed(乱数生成の初期値), temperature(確率分布の鋭さを制御)を使用しています。
  • 再生音は候補に挙がった音声の中から、ご自分の気に入った音声を選択願います。