您好,登錄后才能下訂單哦!
基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎樣的,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。
和 https://blog.csdn.net/u013625492/article/details/114433738 中 GE2E 的版本幾乎一致
區別就是文本是 英文, 使用 VCTK 等英文數據集訓練
https://github.com/ruclion/Tuned-GE2E-SayEN-EarSpeech
之前訓練 AutoVC 用過
處理數據的邏輯從: /ceph/home/hujk17/Tuned-GE2E-SayEN-EarSpeech/FaPig_extract_GE2E_VCTK_nosli.py 開始
保留了 train, val, unseen. 訓練的時候只使用 train
在 2.1. 中也一并提取了, 使用 GE2E
在 2.1. 中也一并提取了, 使用 實驗室的 mel. 嘿嘿(●ˇ?ˇ●), 終于方便啦
symbols 不用動, 本身就保留了英文的標點
需要改下 train.txt 的路徑
以 Kiss 為模型名字, 邏輯從 Kiss_train.py 開始
直接用 本來的小 Batch 訓練, batch_size = 12
256 的 Embedding 仍然后面接了一個 FC, 和中文的一致
中文的叫 FaPig, 英文叫 Kiss, 邏輯從 Kiss_train.py 開始
from synthesizer.FaPig_train import train 和 from synthesizer.Kiss_train import train 其實完全一致, 只是為了統一格式, 拷貝了一份
看完上述內容,你們掌握基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎樣的的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。