Skip to content

pyVideoTrans视频翻译软件v3.74-0720版起,已集成阿里的Qwen3-TTS语音合成服务!

简单来说,Qwen-TTS是一项先进的语音合成技术,它可以将文字转换成听起来非常真实、自然的人声。它的一大亮点是能够根据文本内容自动调整语音的节奏和情感。

支持2种形式的Qwen3-TTS:

  • 一是阿里百炼的在线API
  • 二是软件内置的本地Qwen3-TTS。

一:Qwen3-TTS 阿里百炼API (在线版)

qwen3-tts模型支持10种语言和多种中文方言 模型名称 qwen3-tts-flash

点此查看 qwen3-tts 具体音色及支持语言描述

json
{
  "芊悦(Cherry)": "Cherry",
  "苏瑶(Serena)": "Serena",
  "晨煦(Ethan)": "Ethan",
  "千雪(Chelsie)": "Chelsie",
  "茉兔(Momo)": "Momo",
  "十三(Vivian)": "Vivian",
  "月白(Moon)": "Moon",
  "四月(Maia)": "Maia",
  "凯(Kai)": "Kai",
  "不吃鱼(Nofish)": "Nofish",
  "萌宝(Bella)": "Bella",
  "詹妮弗(Jennifer)": "Jennifer",
  "甜茶(Ryan)": "Ryan",
  "卡捷琳娜(Katerina)": "Katerina",
  "艾登(Aiden)": "Aiden",
  "沧明子(Eldric Sage)": "Eldric Sage",
  "乖小妹(Mia)": "Mia",
  "沙小弥(Mochi)": "Mochi",
  "燕铮莺(Bellona)": "Bellona",
  "田叔(Vincent)": "Vincent",
  "萌小姬(Bunny)": "Bunny",
  "阿闻(Neil)": "Neil",
  "墨讲师(Elias)": "Elias",
  "徐大爷(Arthur)": "Arthur",
  "邻家妹妹(Nini)": "Nini",
  "诡婆婆(Ebona)": "Ebona",
  "小婉(Seren)": "Seren",
  "顽屁小孩(Pip)": "Pip",
  "少女阿月(Stella)": "Stella",
  "博德加(Bodega)": "Bodega",
  "索尼莎(Sonrisa)": "Sonrisa",
  "阿列克(Alek)": "Alek",
  "多尔切(Dolce)": "Dolce",
  "素熙(Sohee)": "Sohee",
  "小野杏(Ono Anna)": "Ono Anna",
  "莱恩(Lenn)": "Lenn",
  "埃米尔安(Emilien)": "Emilien",
  "安德雷(Andre)": "Andre",
  "拉迪奥·戈尔(Radio Gol)": "Radio Gol",
  "上海-阿珍(Jada)": "Jada",
  "北京-晓东(Dylan)": "Dylan",
  "南京-老李(Li)": "Li",
  "陕西-秦川(Marcus)": "Marcus",
  "闽南-阿杰(Roy)": "Roy",
  "天津-李彼得(Peter)": "Peter",
  "四川-晴儿(Sunny)": "Sunny",
  "四川-程川(Eric)": "Eric",
  "粤语-阿强(Rocky)": "Rocky",
  "粤语-阿清(Kiki)": "Kiki"
}

第一步:获取并配置您的API KEY

  1. 请点击此链接访问阿里云百炼平台:https://bailian.console.aliyun.com/?tab=model#/api-key

  1. 登录您的阿里云账户(若无账户,按提示注册一个即可)。

  2. 在API-KEY管理页面,点击“创建API-KEY”,系统会自动生成一串以“sk-”开头的字符,这就是您的API KEY。请复制这串字符。

  3. 回到pyVideoTrans软件,在顶部菜单栏找到 TTS设置,点击后在下拉菜单中选择 Qwen TTS

  4. 在弹出的Qwen3 TTS配置窗口中,将您刚刚复制的 API KEY 粘贴到“API KEY”输入框中。您可以点击“测试”按钮,试听一下效果,如果能听到声音,说明配置成功。最后,点击 保存

第二步:在视频翻译中使用Qwen3-TTS

配置完成后,您就可以在处理单个视频时启用Qwen3-TTS了。

  • 在pyVideoTrans的主界面,找到 “配音渠道” 的下拉菜单,点击并选择 “Qwen3 TTS”
  • 在旁边的 “配音角色” 菜单中,您可以选择您喜欢的音色,比如选择“Cherry”体验标准女声,或选择“Sunny”来一段有趣的四川话配音。

第三步:在批量配音和多角色配音中使用

Qwen-TTS的强大功能同样适用于批量处理任务,大大提升您的工作效率。

  • 批量为字幕配音:如果您有多个SRT字幕文件需要配音,可以切换到 “批量为字幕配音” 界面。在下方的“配音渠道”中同样选择 “Qwen TTS” 和您想要的角色即可。
  • 字幕多角色配音:在处理包含多个角色的对话时,此功能同样适用。您可以在“字幕多角色配音”功能区为不同角色分配Qwen-TTS的不同音色。



二:Qwen3-TTS 本地内置 (离线版)

请确认已升级到 3.97+ 版本

3.97 版本后新增了对本地部署 Qwen3-TTS 的支持。内置可直接使用,固定使用 1.7B 尺寸的模型。

参考音频:

适用于基于一段 3-10 秒的参考音频来克隆声音。

在 菜单--工具--TTS设置--Qwen-tts(本地),填写参考音频和该音频对应文字内容,一行一组,可在配音角色中选择使用该参考音频进行克隆

示例

n10.wav#你说四大皆空,却为何紧闭双眼,你若挣开眼睛看看我,我不相信,你两眼空空

将 n10.wav 音频文件放在软件目录下的f5-tts文件夹内,然后在#号后填写音频对应说话文本

语音风格指导词

当使用Qwen-TTS模型内置的 Vivian, Uncle_fu, Sohee 预设音色时,可填写一段指导

打开 菜单--工具--TTS设置--Qwen-tts(本地) 在提示词(prompt)文本框中填写简短提示词,例如使用愤怒发疯的语气,在使用内置音色时,将自动应用该提示词。

  • 👤 启动自定义音色-0.6B模型.bat
  • 👤 启动自定义音色-1.7B模型.bat