Skip to content

OmniVoice 是一款先进的零样本多语言 TTS 模型,支持 600 多种语言。能够生成高质量的语音,具有卓越的推理速度,并支持语音克隆

从 pyVideoTrans v3.98-0403 版本起,已支持使用 OmniVoice 进行配音,以下讲述使用源码部署 OmniVoice 和下载 OmniVoice 整合包

直接下载 OmniVoice 整合包--仅限Windows使用

百度网盘下载: https://pan.baidu.com/s/1ICZ0aIafrLG8RuLxDgMNCA?pwd=1234

huggingface.co下载: https://huggingface.co/mortimerme/repocollect/resolve/main/OmniVoice-0403.7z?download=true

  1. 下载.7z文件后解压,然后双击start.bat,等待启动成功,成功标志是出现并停留在下图

第一次启动将下载模型,默认从国内镜像站 https://hf-mirror.com 下载,源站国内无法直接访问,需科学上网(https://huggingface.co)

  1. 打开 pyVideoTrans软件,到菜单--TTS设置--OmniVoice-URL 填写http://127.0.0.1:8081,然后在下方角色列表中填写需要使用的参考音频及其对应文本

参考音频是指你希望用来进行克隆音频的wav文件,最佳时长在3-10秒,发音清晰,

例如已有音频nverguo.wav,音频内是纯净的女儿国王说话声,将它放在pyVideoTrans软件下的f5-tts文件夹内,在设置界面角色文本框内填写该音频对应的文本内容

nverguo.wav#这里填写说话的文字内容

  1. 点击测试,若提示OK,则保存,去使用即可

使用源码部署

  1. 点击去 OmniVoice 官方代码仓库下载源码,打开后点击首页中部的绿色<>Code按钮,再点击Download ZIP,即可下载一个zip文件,将该文件解压到你想要的某个文件夹内。然后点击OmniVoice-master进入到含有pyproject.toml的文件夹内
  2. 下载 uv , 打开终端命令行执行uv安装命令curl -LsSf https://astral.sh/uv/install.sh | sh

如果是windows,可点击下载uv压缩包 解压后将uv.exepyproject.toml放在一起

  1. 在 pyproject.toml 所在文件夹内打开终端,如果是windows,可在文件夹地址栏输入cmd回车自动打开。然后执行该命令uv sync安装模块,国内安装较慢,可使用该命令加速安装uv sync --default-index "https://mirrors.aliyun.com/pypi/simple"

  2. 下载模型,模型所在网站 https://huggingface.co 国内无法直接访问,如果你没有科学上网,请按照如下设置镜像

在终端输入以下命令启用模型下载镜像: windows的cmd上输入set HF_ENDPOINT=https://hf-mirror.com,然后回车。MacOSX和Linux输入export HF_ENDPOINT=https://hf-mirror.com

  1. 启动接口,在终端执行命令uv run omnivoice-demo --ip 0.0.0.0 --port 8081
  2. 打开 pyVideoTrans软件,到菜单--TTS设置--OmniVoice-URL 填写http://127.0.0.1:8081,然后在下方角色列表中填写需要使用的参考音频及其对应文本

参考音频是指你希望用来进行克隆音频的wav文件,最佳时长在3-10秒,发音清晰

例如已有音频nverguo.wav,音频内是纯净的女儿国王说话声,将它放在pyVideoTrans软件下的f5-tts内,然后在设置界面角色文本框内填写该音频对应的文本内容

nverguo.wav#这里填写说话的文字内容

  1. 点击测试,若提示OK,则保存,去使用即可

常见问题

  1. 源码部署时,解压源码后看不到 pyproject.toml?

解压后默认会显示一个OmniVoice-master文件夹,点击进去,会看到pyproject.tomlpyproject,所有操作均需要在此文件夹内进行

  1. 提示 uv 不是内部或外部命令

说明未安装uv,或未放入系统环境,windows点击下载uv压缩包 解压后将复制uv.exe,粘贴到 pyproject.toml所在目录内

其他系统直接执行命令即可安装curl -LsSf https://astral.sh/uv/install.sh | sh

  1. 下载模型很慢最终失败了?

默认从模型原始站下载,这个网站在国内无法打开,要么你需要科学上网,确保可以访问 https://huggingface.co 要么设置模型镜像源

Win上在终端执行命令 set HF_ENDPOINT=https://hf-mirror.com

MacOSX和Linux执行 export HF_ENDPOINT=https://hf-mirror.com

  1. uv sync 执行中失败? 这是模块安装过程,同样默认从国外下载,你可以尝试使用国内阿里镜像源,使用uv sync --default-index "https://mirrors.aliyun.com/pypi/simple" 代替 uv sync 命令

  2. 使用了 阿里镜像源还是失败?

可能你计算机缺少MSVC 环境,请点击按此方案安装 MSVC 环境

  1. 如何直接在网页使用 OmniVoice 进行配音?

启动完成后,可直接在浏览器里打开 http://127.0.0.1:8081

  1. 整合包里如何修改启动端口和模型镜像?

使用记事本打开start.bat,如果不想使用国内下载镜像,直接删除set "HF_ENDPOINT=https://hf-mirror.com" 这行。

如果想修改启动端口,直接修改set "PORT=8081"中的 8081 为你想要的端口。