1.选取模型

在官方中文文档区域下载模型

MockingBird/README-CN.md at main · babysor/MockingBird (github.com)

或者下载我训练的模型

分享下自己训练的模型 · Issue #490 · babysor/MockingBird (github.com)

训练自己模型放在日后讲解

2.打开工具箱

2.1 打开网络工具箱

进入 Mockingbird-main,在此处打开cmd,输入

python web.py

若出现

D:\liandanwenjianjiabunengyongyingwen\MockingBird-main>python web.py
Loaded synthesizer models: 13
Loaded encoder "pretrained.pt" trained to step 1594501
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at vocoder\saved_models\pretrained\pretrained.pt
Building hifigan
Loading 'vocoder\saved_models\pretrained\g_hifigan.pt'
Complete.
Removing weight norm...
Web server:http://localhost:8080
127.0.0.1 - - [2022-04-05 23:36:57] "GET / HTTP/1.1" 200 16488 0.029975
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/recorder-core.js HTTP/1.1" 304 147 0.582231
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/mp3.js HTTP/1.1" 304 137 0.001998
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/wav.js HTTP/1.1" 304 137 0.003002
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/mp3-engine.js HTTP/1.1" 304 144 0.002996
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/frequency.histogram.view.js HTTP/1.1" 304 158 0.002997
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/lib.fft.js HTTP/1.1" 304 141 0.003000
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/js/jquery.js HTTP/1.1" 304 140 0.002995
127.0.0.1 - - [2022-04-05 23:36:58] "GET /static/img/bird.png HTTP/1.1" 304 139 0.002001
127.0.0.1 - - [2022-04-05 23:36:58] "GET /api/synthesizers/ HTTP/1.1" 200 1388 0.002000

且浏览器自动弹出工具箱,则成功打开网络工具箱。若没有自动弹出,则手动进入

http://localhost:8080

2.2 进入python工具箱

进入 Mockingbird-main,在此处打开cmd,输入

python demo_toolbox.py

若出现

D:\liandanwenjianjiabunengyongyingwen\MockingBird-main>python demo_toolbox.py
Arguments:
    datasets_root:    None
    enc_models_dir:   encoder\saved_models
    syn_models_dir:   synthesizer\saved_models
    voc_models_dir:   vocoder\saved_models
    cpu:              False
    seed:             None
    no_mp3_support:   False

Warning: you did not pass a root directory for datasets as argument.
The recognized datasets are:
        LibriSpeech/dev-clean
        LibriSpeech/dev-other
        LibriSpeech/test-clean
        LibriSpeech/test-other
        LibriSpeech/train-clean-100
        LibriSpeech/train-clean-360
        LibriSpeech/train-other-500
        LibriTTS/dev-clean
        LibriTTS/dev-other
        LibriTTS/test-clean
        LibriTTS/test-other
        LibriTTS/train-clean-100
        LibriTTS/train-clean-360
        LibriTTS/train-other-500
        LJSpeech-1.1
        VoxCeleb1/wav
        VoxCeleb1/test_wav
        VoxCeleb2/dev/aac
        VoxCeleb2/test/aac
        VCTK-Corpus/wav48
        aidatatang_200zh/corpus/dev
        aidatatang_200zh/corpus/test
        aishell3/test/wav
        magicdata/train
Feel free to add your own. You can still use the toolbox by recording samples yourself.

且自动弹出MockingBird GUI窗口,则成功打开

3. 使用工具箱

网页版工具箱基于python工具箱,故只讨论python工具箱的使用

3.1 选择模型

将你下载的模型放入MockingBird-main\synthesizer\saved_models内,在此处选择

从左到右依次是编码器,合成器,解码器。编码器和解码器暂时不需要管,在第二项合成器Synthesizer处选择你下载的模型

3.2 选择音频

Browse(打开本地)可以选择你自己的wav文件作文音源,Record可以录音作为音源,两者二选一,下面的Play(播放)和Stop(暂停)是播放你所选取的音频或者你的录音

3.3 开始合成

文字框用来输入你想合成的文字,Synthesize and vocade是合成并播放Synthesize only是仅合成,Vocade only是播放你合成过的声音

下方的style是风格,不同的数字会有不同的语调 ,但本人模型数据集太少没用明显效果,建议保持-1不变、Accuracy是精度,本人的模型在6时发挥最好,你也可以尝试最适合你模型的数值。MaxLength是最大句长,越大句子长度就越长,但我调整之后未发现改变,也许是我理解有问题,望懂的大佬在评论区解决我的疑问

4. 免责声明

此模型仅供学习交流使用,严禁用于商业用途,下载后请于24小时内删除。使用本模型所导致的一切后果不由本人承担,所有与使用本模型相关的直接风险均由使用者承担。严禁使用此模型进行违反国家法律法规的使用,一经发现本人将收集有关证据举报给公安机关。当你下载此模型时,即视为同意此免责声明。任何单位或个人认为通过本模型可能涉嫌侵犯其合法权益,应该及时向本人评论或邮箱反馈,并提供身份证明、权属证明及详细侵权情况证明,本人在收到上述法律文件后,将会尽快移除此模型

用模型合成的免责声明音频

5. 完结

目前使用教程已经完成,还差模型制作教程。这个可能得留到下个月制作了,因为很复杂。最近马上 是一次调考,所以我得复习,离高考还有63天了,尽量挤时间出来写吧。晚安各位,熬夜的注意别熬太晚,早点休息对身体好,我继续去看物理网课了,拜~


啥也没有