OmniVoice 是一款先进的零样本多语言 TTS 模型,支持 600 多种语言。能够生成高质量的语音,具有卓越的推理速度,并支持语音克隆
从 pyVideoTrans v3.98-0403 版本起,已支持使用 OmniVoice 进行配音,以下讲述使用源码部署 OmniVoice 和下载 OmniVoice 整合包
直接下载 OmniVoice 整合包--仅限Windows使用
百度网盘下载: https://pan.baidu.com/s/1ICZ0aIafrLG8RuLxDgMNCA?pwd=1234
huggingface.co下载: https://huggingface.co/mortimerme/repocollect/resolve/main/OmniVoice-0403.7z?download=true
- 下载
.7z文件后解压,然后双击start.bat,等待启动成功,成功标志是出现并停留在下图

第一次启动将下载模型,默认从国内镜像站 https://hf-mirror.com 下载,源站国内无法直接访问,需科学上网(https://huggingface.co)
- 打开
pyVideoTrans软件,到菜单--TTS设置--OmniVoice-URL填写http://127.0.0.1:8081,然后在下方角色列表中填写需要使用的参考音频及其对应文本
参考音频是指你希望用来进行克隆音频的wav文件,最佳时长在3-10秒,发音清晰,
例如已有音频
nverguo.wav,音频内是纯净的女儿国王说话声,将它放在pyVideoTrans软件下的f5-tts文件夹内,在设置界面角色文本框内填写该音频对应的文本内容
nverguo.wav#这里填写说话的文字内容

- 点击测试,若提示OK,则保存,去使用即可
使用源码部署
- 点击去 OmniVoice 官方代码仓库下载源码,打开后点击首页中部的绿色
<>Code按钮,再点击Download ZIP,即可下载一个zip文件,将该文件解压到你想要的某个文件夹内。然后点击OmniVoice-master进入到含有pyproject.toml的文件夹内 - 下载 uv , 打开终端命令行执行uv安装命令
curl -LsSf https://astral.sh/uv/install.sh | sh
如果是windows,可点击下载uv压缩包 解压后将
uv.exe和pyproject.toml放在一起
在 pyproject.toml 所在文件夹内打开终端,如果是windows,可在文件夹地址栏输入
cmd回车自动打开。然后执行该命令uv sync安装模块,国内安装较慢,可使用该命令加速安装uv sync --default-index "https://mirrors.aliyun.com/pypi/simple"下载模型,模型所在网站 https://huggingface.co 国内无法直接访问,如果你没有科学上网,请按照如下设置镜像
在终端输入以下命令启用模型下载镜像: windows的cmd上输入
set HF_ENDPOINT=https://hf-mirror.com,然后回车。MacOSX和Linux输入export HF_ENDPOINT=https://hf-mirror.com
- 启动接口,在终端执行命令
uv run omnivoice-demo --ip 0.0.0.0 --port 8081 - 打开
pyVideoTrans软件,到菜单--TTS设置--OmniVoice-URL填写http://127.0.0.1:8081,然后在下方角色列表中填写需要使用的参考音频及其对应文本
参考音频是指你希望用来进行克隆音频的wav文件,最佳时长在3-10秒,发音清晰
例如已有音频
nverguo.wav,音频内是纯净的女儿国王说话声,将它放在pyVideoTrans软件下的f5-tts内,然后在设置界面角色文本框内填写该音频对应的文本内容
nverguo.wav#这里填写说话的文字内容
- 点击测试,若提示OK,则保存,去使用即可
常见问题
- 源码部署时,解压源码后看不到
pyproject.toml?
解压后默认会显示一个OmniVoice-master文件夹,点击进去,会看到pyproject.toml或pyproject,所有操作均需要在此文件夹内进行
- 提示
uv 不是内部或外部命令?
说明未安装uv,或未放入系统环境,windows点击下载uv压缩包 解压后将复制uv.exe,粘贴到 pyproject.toml所在目录内
其他系统直接执行命令即可安装curl -LsSf https://astral.sh/uv/install.sh | sh
- 下载模型很慢最终失败了?
默认从模型原始站下载,这个网站在国内无法打开,要么你需要科学上网,确保可以访问 https://huggingface.co 要么设置模型镜像源
Win上在终端执行命令 set HF_ENDPOINT=https://hf-mirror.com
MacOSX和Linux执行 export HF_ENDPOINT=https://hf-mirror.com
uv sync执行中失败? 这是模块安装过程,同样默认从国外下载,你可以尝试使用国内阿里镜像源,使用uv sync --default-index "https://mirrors.aliyun.com/pypi/simple"代替uv sync命令使用了 阿里镜像源还是失败?
可能你计算机缺少MSVC 环境,请点击按此方案安装 MSVC 环境
- 如何直接在网页使用 OmniVoice 进行配音?
启动完成后,可直接在浏览器里打开 http://127.0.0.1:8081
- 整合包里如何修改启动端口和模型镜像?
使用记事本打开start.bat,如果不想使用国内下载镜像,直接删除set "HF_ENDPOINT=https://hf-mirror.com" 这行。
如果想修改启动端口,直接修改set "PORT=8081"中的 8081 为你想要的端口。

