从 pyVideoTrans v3.99-0421 版本起,已支持使用 MOSS-TTS-Nano-100M 进行配音
使用源码部署 MossTTS
- 点击去 MOSS-TTS-Nano-100M 官方代码仓库 按照说明部署后,然后执行
python app.py启动API - 打开
pyVideoTrans软件,到菜单--TTS设置--MossTTS-API URL填写接口地址,默认http://127.0.0.1:18083,然后在下方角色列表中填写需要使用的参考音频及其对应文本
参考音频是指你希望用来进行克隆音频的wav文件,最佳时长在3-10秒,发音清晰
例如已有音频
nverguo.wav,音频内是纯净的女儿国王说话声,将它放在pyVideoTrans软件下的f5-tts内,然后在设置界面角色文本框内填写该音频对应的文本内容
nverguo.wav#这里填写说话的文字内容
- 点击测试,若提示OK,则保存,去使用即可
