Skip to content

配音渠道:Qwen-TTS

支持的语言:中文、英文、日文、韩文、德文、法文、俄文、葡萄牙文、西班牙文和意大利文

Qwen-TTS 是阿里通义千问团队推出的先进语音合成技术,能够将文字转换成非常真实、自然的人声。它的一大亮点是能根据文本内容自动调整语音的节奏和情感。

pyVideoTrans 支持 2 种形式的 Qwen3-TTS:

  • 本地内置版(离线版):软件内置,无需联网,固定使用 1.7B 模型
  • 阿里百炼 API(在线版):通过阿里云 API 调用,需联网和 API Key

一、Qwen3-TTS 本地内置(离线版)

前置条件

条件说明
pyVideoTrans 版本≥ v3.97
模型大小约 8GB(首次使用自动下载)
硬件建议有 NVIDIA 显卡(GPU 加速)

第一步:确认版本

请确认已升级到 3.97+ 版本,内置可直接使用,固定使用 1.7B 尺寸的模型。

第二步:下载模型(首次使用自动下载)

第一次使用将自动下载 Base 和 CustomVoice 两套模型,合计大约 8GB,请耐心等待。

手动下载方法(可选)

如果自动下载太慢,可手动下载:

  1. 打开软件目录下的 models 文件夹,新建 2 个文件夹:

    • models--Qwen--Qwen3-TTS-12Hz-1.7B-Base
    • models--Qwen--Qwen3-TTS-12Hz-1.7B-CustomVoice
  2. 打开 Base 模型下载页,将所有文件和文件夹下载后放到 models/models--Qwen--Qwen3-TTS-12Hz-1.7B-Base 文件夹内

  3. 打开 CustomVoice 模型下载页,同样下载所有文件和文件夹到 models/models--Qwen--Qwen3-TTS-12Hz-1.7B-CustomVoice 文件夹内

如下图所示:

第三步:配置参考音频

适用于基于一段 3~10 秒的参考音频来克隆声音。

操作路径:菜单 → 工具 → TTS设置 → Qwen-tts(本地)

填写参考音频和该音频对应文字内容,一行一组。

格式

音频文件名#音频对应的文字内容

示例

n10.wav#你说四大皆空,却为何紧闭双眼,你若挣开眼睛看看我,我不相信,你两眼空空

n10.wav 音频文件放在软件目录下的 f5-tts 文件夹内,然后在 # 号后填写音频对应说话文本。

第四步:语音风格指导词(可选)

当使用 Qwen-TTS 模型内置的 Vivian、Uncle_fu、Sohee 预设音色时,可填写一段指导词来控制语音风格。

操作路径:菜单 → 工具 → TTS设置 → Qwen-tts(本地)

在「提示词(prompt)」文本框中填写简短提示词,例如:

使用愤怒发疯的语气

在使用内置音色时,将自动应用该提示词。


二、Qwen3-TTS 阿里百炼 API(在线版)

qwen3-tts 模型支持 10 种语言和多种中文方言 模型名称:qwen3-tts-flash点此查看 qwen3-tts 具体音色及支持语言描述

第一步:获取并配置 API KEY

  1. 点击此链接访问阿里云百炼平台:https://bailian.console.aliyun.com/?tab=model#/api-key

  1. 登录您的阿里云账户(若无账户,按提示注册一个即可)
  2. 在 API-KEY 管理页面,点击「创建 API-KEY」,系统会自动生成一串以 sk- 开头的字符,这就是您的 API KEY,请复制这串字符
  3. 回到 pyVideoTrans 软件,在顶部菜单栏找到 TTS设置 → Qwen TTS

  1. 在弹出的「Qwen3 TTS」配置窗口中,将 API KEY 粘贴到「API KEY」输入框中。点击「测试」按钮试听效果,如果能听到声音说明配置成功。最后点击「保存」。

第二步:在视频翻译中使用 Qwen3-TTS

配置完成后,在主界面的「配音渠道」下拉菜单中选择「Qwen3 TTS」,在旁边的「配音角色」菜单中选择您喜欢的音色。

  • Cherry:标准女声
  • Sunny:四川话配音
  • Dylan:北京话
  • 更多音色见下方列表

第三步:在批量配音和多角色配音中使用

Qwen-TTS 的强大功能同样适用于批量处理任务:

  • 批量为字幕配音:在「批量为字幕配音」界面,下方「配音渠道」中选择「Qwen TTS」和您想要的角色
  • 字幕多角色配音:在「字幕多角色配音」功能区为不同角色分配 Qwen-TTS 的不同音色


三、可用音色列表

以下是 Qwen3-TTS 支持的所有音色(在线版):

中文名英文代码类型
芊悦(Cherry)Cherry标准女声
苏瑶(Serena)Serena标准女声
晨煦(Ethan)Ethan标准男声
千雪(Chelsie)Chelsie标准女声
茉兔(Momo)Momo标准女声
十三(Vivian)Vivian标准女声
月白(Moon)Moon标准女声
四月(Maia)Maia标准女声
凯(Kai)Kai标准男声
不吃鱼(Nofish)Nofish标准男声
萌宝(Bella)Bella童声
詹妮弗(Jennifer)Jennifer英文女声
甜茶(Ryan)Ryan英文男声
卡捷琳娜(Katerina)Katerina俄语女声
艾登(Aiden)Aiden英文男声
沧明子(Eldric Sage)Eldric Sage英文男声
乖小妹(Mia)Mia标准女声
沙小弥(Mochi)Mochi标准女声
燕铮莺(Bellona)Bellona标准女声
田叔(Vincent)Vincent标准男声
萌小姬(Bunny)Bunny标准女声
阿闻(Neil)Neil标准男声
墨讲师(Elias)Elias标准男声
徐大爷(Arthur)Arthur标准男声
邻家妹妹(Nini)Nini标准女声
诡婆婆(Ebona)Ebona标准女声
小婉(Seren)Seren标准女声
顽屁小孩(Pip)Pip童声
少女阿月(Stella)Stella标准女声
博德加(Bodega)Bodega标准男声
索尼莎(Sonrisa)Sonrisa标准女声
阿列克(Alek)Alek标准男声
多尔切(Dolce)Dolce标准女声
素熙(Sohee)Sohee韩语女声
小野杏(Ono Anna)Ono Anna日语女声
莱恩(Lenn)Lenn标准男声
埃米尔安(Emilien)Emilien法语男声
安德雷(Andre)Andre标准男声
拉迪奥·戈尔(Radio Gol)Radio Gol标准男声
上海-阿珍(Jada)Jada上海话女声
北京-晓东(Dylan)Dylan北京话男声
南京-老李(Li)Li南京话男声
陕西-秦川(Marcus)Marcus陕西话男声
闽南-阿杰(Roy)Roy闽南话男声
天津-李彼得(Peter)Peter天津话男声
四川-晴儿(Sunny)Sunny四川话女声
四川-程川(Eric)Eric四川话男声
粤语-阿强(Rocky)Rocky粤语男声
粤语-阿清(Kiki)Kiki粤语女声

四、常见问题

1. 本地版首次下载模型很慢

首次使用将自动下载约 8GB 模型文件,请耐心等待。如需加速,可参考上方「手动下载方法」从 HuggingFace 下载。

2. API 版报错 AuthenticationError

API KEY 无效或过期,请重新登录阿里云百炼平台获取新的 API KEY。

3. 配音效果不自然

  • 尝试更换不同的音色
  • 在本地版中尝试填写语音风格指导词
  • 确保参考音频质量良好(发音清晰、无噪音)