-
Notifications
You must be signed in to change notification settings - Fork 5.2k
Quick Start (Newbie)
本快速开始教程是以Windows为例的,假设不做任何训练(节省几小时甚至几天时间),假设你对python等开发环境也不熟悉,也可能没有支持CUDA的GPU
如果已经确认安装过,请忽略该步骤
-
拉取本代码库
-
安装Anacodna, Python 3.8 或更高,参考中文教程,在Anaconda中创建并切换到独立虚拟环境后,进行以下步骤。
-
安装 PyTorch, 直接官网下载。如果GPU不支持CUDA,请默认选择。
验证本步骤是否成功:在系统任意路径下运行python,进入交互式编程界面后输入
import torch;
, 回车,torch.cuda.is_available()
, 回车。如果都是成功的话,可以进行下一步。
-
安装 ffmpeg。 1)下载 选择点击打开链接Windows对应的版本下载 2)解压 ffmpeg-xxxx.zip 文件到指定目录; 3)将解压后的文件目录中 bin 目录(包含 ffmpeg.exe )添加进 path 环境变量中; 4)进入 cmd,输入 ffmpeg -version,可验证当前系统是否识别 ffmpeg 以及查看 ffmpeg 的版本
-
运行pip install -r requirements.txt 来安装剩余的必要包。
确保本步骤不报错
- 安装 webrtcvad 用 pip install webrtcvad-wheels。
确保本步骤不报错
在以下选择中下载模型
作者 | 下载链接 | 效果预览 |
---|---|---|
@miven | https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码:2021 | https://www.bilibili.com/video/BV1uh411B7AD/ |
该模型与最新代码有兼容性问题 请查阅 https://github.com/babysor/MockingBird/issues/37 解决
下载完成后,确保 xxx.pt
格式的文件放在代码库的 synthesizer\saved_models
文件夹下,saved_models
如不存在请新建
在代码库路径下,运行 python demo_toolbox.py -d .\samples
尝试使用工具箱, 由于没有下载任何数据集,这里的功能比较简单:
- 确保界面左边中间的
synthesizer
选择了上一步中xxx.pt
文件对应的模型。 - 点击
Record
录入你的5秒语音 - 输入任意文字
- 点击
Synthesizer and vocode
等待效果输出
使用技巧参考:https://zhuanlan.zhihu.com/p/425692267
遇到任何报错可以在issue中搜索