Skip to content

VoxCPM-0.5B 很小但很棒的音色克隆一键整合包

VoxCPM:无需标记器的 TTS,用于上下文感知语音生成和逼真的语音克隆

下载地址:https://pan.baidu.com/s/1CvM_3E5YqE5s8zTHHvjSSw?pwd=hj7b

使用方法

  1. 下载解压
  2. 双击双击启动.bat,第一次启动将从 modelscope.cn 下载 SenseVoiceSmall 模型,该模型用于将参考音频转录为对应文本。

  1. 启动成功后会自动在浏览器中打开操作界面,如果未打开,请手动在浏览器中访问 http://127.0.0.1:7860

启动中界面启动中

如果最终窗口底部显示如下图,说明成功.

如果最终出现Error: 如下图字样,则失败,请关闭窗口重新打开

  1. 成功后,将自动在浏览器中打开地址http://127.0.0.1:7860

  1. 上传3-10s的参考音频用于克隆它的音色,上传后会自动识别生成对应的文本内容,也可以手动修改,然后填写要合成语音的文字。

注意:

  1. 整合包已含模型,但可能仍会检测模型更新,如果使用时出现网络连接失败,报错有类似HTTPConnection字符串,并且你不会科学上网,可右键编辑双击启动.bat,将rem set HF_ENDPOINT=https://hf-mirror.com 这行前的rem删掉,然后保存,重新双击启动该文件。

  2. 如果你会科学上网并知道你所用工具的代理端口,可不必进行上一步操作,而是rem set https_proxy=http://127.0.0.1:10808 将改行前的rem删掉,并将10808端口改为你的代理端口,保存,重新启动,将能确保连接更加稳定,不易出现连接错误。