配音渠道

配音（TTS）是视频翻译的第三步，将翻译后的字幕文本转换为语音音频。pyVideoTrans 支持 30+ 种配音渠道。

也可通过左侧面板批量为字幕配音单独使用配音功能，支持导入多个srt字幕文件或txt文件进行配音。
角色clone代表使用原始视频中的说话人音色进行配音，以实现语音克隆，该角色仅在主界面视频翻译功能中可用。
有clone角色渠道均支持自定义参考音频，即克隆你自己准备的一段3-10s的音频中的音色，使用该音色配音，具体方法见下方的制作和使用参考音频

开箱即用（免费）

无需复杂配置，非常适合新手。

渠道	说明	推荐度
Edge-TTS(免费)	微软免费接口，声音自然，支持所有语种	⭐⭐⭐ 默认推荐
gTTS(免费)	Google TTS，基础质量，国内需科学上网	⭐⭐

⚠️ Edge-TTS 短时间内大量使用可能触发限流，建议在高级选项中将并发数设为 1，暂停秒数设为 5-10。

本地内置（免费）

首次使用时自动下载模型。

渠道	说明	GPU 加速	支持克隆(`clone`角色)	推荐度
Qwen3-TTS(本地内置)	支持中文、英文、日文、韩文、德文、法文、俄文、葡萄牙文、西班牙文和意大利文	✅	✅	⭐⭐⭐ 推荐
F5-TTS(本地内置)	中英日法德俄意、西班牙、印地、阿拉伯语	✅	✅	⭐⭐⭐
OmniVoice-TTS	支持600种语言(v4.05起内置)	✅	✅	⭐⭐⭐ 推荐
Confucius-TTS(本地内置)v4.06起	中文、英文、日语、韩语、德语、法语、西班牙语、印尼语、意大利语、泰语、葡萄牙语、俄语、马来语、越南语	✅	✅	⭐⭐⭐
MOSS-TTS-Nano(本地内置)	中文、英文、德文、西班牙文、法文、日文、意大利文、匈牙利文、韩文、俄文、波斯文、阿拉伯文、波兰文、葡萄牙文、捷克文、瑞典文、希腊文、土耳其文	❌	✅	⭐⭐
ZipVoice(本地内置)	中英语言	✅	✅	⭐⭐⭐ 推荐
Piper(本地内置)	轻量级，支持20种语言	❌	❌	⭐⭐
ChatterBox(本地内置)	阿拉伯语、德语、希腊语、英语、西班牙语、芬兰语、法语、希伯来语、印地语、意大利语、日语、韩语、马来语、荷兰语、挪威语、波兰语、葡萄牙语、俄语、瑞典语、斯瓦希里语、土耳其语、中文	✅	✅	⭐⭐⭐ 推荐
Supertonic3(本地内置)	英语、韩语、日语、阿拉伯语、捷克语、德语、希腊语、西班牙语、法语、印地语、匈牙利语、印尼语、意大利语、荷兰语、波兰语、葡萄牙语、罗马尼亚语、俄语、瑞典语、土耳其语、乌克兰语、越南语	❌	❌	⭐⭐
VITS(本地内置)	中英配音	❌	❌	⭐⭐

因国内网络环境问题，加之模型都比较巨大，自动下载有可能失败，如果失败，请点击查看模型下载地址和手动下载方式

本地自行部署（高阶）

渠道	说明	支持克隆(`clone`角色)	推荐度
GPT-SoVITS	支持中英日韩粤	✅	⭐⭐⭐ 推荐
Index-TTS	中英	✅	⭐⭐⭐ 推荐
VoxCPM-TTS	阿拉伯语、缅甸语、中文、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、高棉语、韩语、老挝语、马来语、挪威语、波兰语、葡萄牙语、俄语、西班牙语、斯瓦希里语、瑞典语、他加禄语、泰语、土耳其语、越南语	✅	⭐⭐⭐
CosyVoice	中文、英语、日语、韩语、德语、西班牙语、法语、意大利语、俄语	✅	⭐⭐
ChatTTS	支持中英	—	⭐⭐
Fish-TTS	支持内置所有语言	—	⭐
Kokoro-TTS	中英韩意葡德法印地	—	⭐
Spark-TTS	中英	✅	⭐⭐
clone-voice	已不维护	✅	⭐

制作和使用参考音频

支持 克隆 的配音渠道(配音角色含有clone,选此即克隆原视频中说话银色)，均可使用参考音频，在配音角色中选择该参考音频，配音时将自动使用该音频音色进行配音，参考音频统一在菜单 → TTS设置 → 设置参考音频中配置。

操作步骤

录制或从已有音频中截取3-10s时长的音频片段，保存为wav格式，并确保发音清晰、无背景噪声。
打开菜单 → TTS设置 → 设置参考音频界面
在文本框中填写以下格式的内容：

音频文件名#该音频文件中对应的文字

将参考音频文件放置在 软件目录/f5-tts 文件夹内（如该文件夹不存在请手动创建）

示例

假设你有一个音频文件 nverguo.wav，音频内容是「女儿国王说话」，则填写：

nverguo.wav#女儿国王说话

参考音频放到pyVideotrans软件内的f5-tts文件夹内，别搞错

参考音频和参考音频内文字

参考音频要求

项目	要求
格式	WAV 格式（推荐），MP3 等格式也可
时长	3~10 秒
内容	发音清晰，无背景噪音
文字	必须与音频内容一致

专业云服务（需 API Key）

渠道	说明	推荐度
Azure TTS	微软专业级语音服务	⭐⭐⭐
OpenAI TTS	声音技术领先	⭐⭐⭐
字节语音合成2.0	中文发音地道	⭐⭐⭐
阿里 Qwen-TTS	阿里云语音合成	⭐⭐⭐
Gemini TTS	谷歌 TTS	⭐⭐
Elevenlabs.io	AI 音频技术公司	⭐⭐⭐
302.AI	聚合平台	⭐⭐
Minimaxi	需充值使用	⭐⭐
小米 TTS	小米 AI 开放平台	⭐⭐
X.AI TTS	x.ai 平台	⭐⭐

配音渠道 ​

开箱即用（免费） ​

本地内置（免费） ​

本地自行部署（高阶） ​

制作和使用参考音频 ​

操作步骤 ​

示例 ​

参考音频要求 ​

专业云服务（需 API Key） ​