VoxCPM-0.5B 很小但很棒的音色克隆一键整合包
VoxCPM:无需标记器的 TTS,用于上下文感知语音生成和逼真的语音克隆
下载地址:https://pan.baidu.com/s/1CvM_3E5YqE5s8zTHHvjSSw?pwd=hj7b
使用方法
- 下载解压
- 双击
双击启动.bat
,第一次启动将从 modelscope.cn 下载 SenseVoiceSmall 模型,该模型用于将参考音频转录为对应文本。
- 启动成功后会自动在浏览器中打开操作界面,如果未打开,请手动在浏览器中访问
http://127.0.0.1:7860
启动中界面
如果最终窗口底部显示如下图,说明成功.
如果最终出现Error:
如下图字样,则失败,请关闭窗口重新打开
- 成功后,将自动在浏览器中打开地址
http://127.0.0.1:7860
- 上传3-10s的参考音频用于克隆它的音色,上传后会自动识别生成对应的文本内容,也可以手动修改,然后填写要合成语音的文字。
注意:
整合包已含模型,但可能仍会检测模型更新,如果使用时出现网络连接失败,报错有类似
HTTPConnection
字符串,并且你不会科学上网,可右键编辑双击启动.bat
,将rem set HF_ENDPOINT=https://hf-mirror.com
这行前的rem
删掉,然后保存,重新双击启动该文件。如果你会科学上网并知道你所用工具的代理端口,可不必进行上一步操作,而是
rem set https_proxy=http://127.0.0.1:10808
将改行前的rem
删掉,并将10808
端口改为你的代理端口,保存,重新启动,将能确保连接更加稳定,不易出现连接错误。