1.选取模型
在官方中文文档区域下载模型
MockingBird/README-CN.md at main · babysor/MockingBird (github.com)
或者下载我训练的模型
分享下自己训练的模型 · Issue #490 · babysor/MockingBird (github.com)
训练自己模型放在日后讲解
2.打开工具箱
2.1 打开网络工具箱
进入 Mockingbird-main,在此处打开cmd,输入
python web.py
若出现
D:\liandanwenjianjiabunengyongyingwen\MockingBird-main>python web.py
Loaded synthesizer models: 13
Loaded encoder "pretrained.pt" trained to step 1594501
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at vocoder\saved_models\pretrained\pretrained.pt
Building hifigan
Loading 'vocoder\saved_models\pretrained\g_hifigan.pt'
Complete.
Removing weight norm...
Web server:http://localhost:8080
127.0.0.1 - - [2022-04-05 23:36:57] "GET / HTTP/1.1" 200 16488 0.029975
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/recorder-core.js HTTP/1.1" 304 147 0.582231
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/mp3.js HTTP/1.1" 304 137 0.001998
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/wav.js HTTP/1.1" 304 137 0.003002
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/mp3-engine.js HTTP/1.1" 304 144 0.002996
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/frequency.histogram.view.js HTTP/1.1" 304 158 0.002997
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/lib.fft.js HTTP/1.1" 304 141 0.003000
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/jquery.js HTTP/1.1" 304 140 0.002995
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/img/bird.png HTTP/1.1" 304 139 0.002001
127.0.0.1 - - [2022-04-05 23:36:58] "GET /api/synthesizers/ HTTP/1.1" 200 1388 0.002000
且浏览器自动弹出工具箱,则成功打开网络工具箱。若没有自动弹出,则手动进入
http://localhost:8080
2.2 进入python工具箱
进入 Mockingbird-main,在此处打开cmd,输入
python demo_toolbox.py
若出现
D:\liandanwenjianjiabunengyongyingwen\MockingBird-main>python demo_toolbox.py
Arguments:
datasets_root: None
enc_models_dir: encoder\saved_models
syn_models_dir: synthesizer\saved_models
voc_models_dir: vocoder\saved_models
cpu: False
seed: None
no_mp3_support: False
Warning: you did not pass a root directory for datasets as argument.
The recognized datasets are:
LibriSpeech/dev-clean
LibriSpeech/dev-other
LibriSpeech/test-clean
LibriSpeech/test-other
LibriSpeech/train-clean-100
LibriSpeech/train-clean-360
LibriSpeech/train-other-500
LibriTTS/dev-clean
LibriTTS/dev-other
LibriTTS/test-clean
LibriTTS/test-other
LibriTTS/train-clean-100
LibriTTS/train-clean-360
LibriTTS/train-other-500
LJSpeech-1.1
VoxCeleb1/wav
VoxCeleb1/test_wav
VoxCeleb2/dev/aac
VoxCeleb2/test/aac
VCTK-Corpus/wav48
aidatatang_200zh/corpus/dev
aidatatang_200zh/corpus/test
aishell3/test/wav
magicdata/train
Feel free to add your own. You can still use the toolbox by recording samples yourself.
且自动弹出MockingBird GUI窗口,则成功打开
3. 使用工具箱
网页版工具箱基于python工具箱,故只讨论python工具箱的使用
3.1 选择模型
将你下载的模型放入MockingBird-main\synthesizer\saved_models内,在此处选择
从左到右依次是编码器,合成器,解码器。编码器和解码器暂时不需要管,在第二项合成器Synthesizer处选择你下载的模型
3.2 选择音频
Browse(打开本地)可以选择你自己的wav文件作文音源,Record可以录音作为音源,两者二选一,下面的Play(播放)和Stop(暂停)是播放你所选取的音频或者你的录音
3.3 开始合成
文字框用来输入你想合成的文字,Synthesize and vocade是合成并播放Synthesize only是仅合成,Vocade only是播放你合成过的声音
下方的style是风格,不同的数字会有不同的语调 ,但本人模型数据集太少没用明显效果,建议保持-1不变、Accuracy是精度,本人的模型在6时发挥最好,你也可以尝试最适合你模型的数值。MaxLength是最大句长,越大句子长度就越长,但我调整之后未发现改变,也许是我理解有问题,望懂的大佬在评论区解决我的疑问
4. 免责声明
此模型仅供学习交流使用,严禁用于商业用途,下载后请于24小时内删除。使用本模型所导致的一切后果不由本人承担,所有与使用本模型相关的直接风险均由使用者承担。严禁使用此模型进行违反国家法律法规的使用,一经发现本人将收集有关证据举报给公安机关。当你下载此模型时,即视为同意此免责声明。任何单位或个人认为通过本模型可能涉嫌侵犯其合法权益,应该及时向本人评论或邮箱反馈,并提供身份证明、权属证明及详细侵权情况证明,本人在收到上述法律文件后,将会尽快移除此模型
5. 完结
目前使用教程已经完成,还差模型制作教程。这个可能得留到下个月制作了,因为很复杂。最近马上 是一次调考,所以我得复习,离高考还有63天了,尽量挤时间出来写吧。晚安各位,熬夜的注意别熬太晚,早点休息对身体好,我继续去看物理网课了,拜~