功能:批量为字幕配音/语音合成
支持配音的字幕或文本格式:
srt/txt
如果你有很多字幕文件或txt文件,想批量为他们创建配音,那么可选择该功能
将您的 SRT 文件或纯文本,通过选择的 TTS 引擎,批量合成为配音文件(如 WAV 或 MP3)。支持精细调整语速、音量和音调。


- 顶部大按钮:可拖拽或点击导入一个或多个srt/txt文件
- 底部大文本框:可直接手动输入文本进行配音,如果你是想为一大段文本配音,可复制粘贴到此,如果是为srt配音,请使用上方大按钮导入
- 字幕语言:即你的字幕语言,此选项决定可用使用哪些角色
- 配音渠道:默认EdgeTTS,这是微软的免费配音渠道,支持所有语言,其他渠道有付费在线API,有免费需本地部署的开源项目,根据需要选择,某些渠道需要在
菜单--TTS设置中填写密钥SK。- 全部配音渠道说明点击查看 - 选择角色:选择字幕语言和配音渠道后,可在此选择想使用的某个角色
- 试听配音:选择音色后,会显示试听配音按钮,点击可试听
- 速度变化百分比:默认0,大于0代表在原本语速基础上加快百分比,例如
10,代表加快10%,-10即代表语速减慢10% - 自动加速:不同语言、不同角色说话语速快慢不同,自然无法保证配音时长恰好等于原字幕时长,选中该复选框,若配音时长大于字幕时长,将强制加速缩短配音时长到字幕区间内
- 删字幕间静音:两条字幕之间通常有空隙,若选中,则删除空隙,声音直接相连,仅当未选择
自动加速时有效 - 音量+:逻辑同
速度变化百分比类似,大于0则音量增加该百分比,小于0则降低 - 音调+:默认0,范围为
-50到50,音调从沉闷到尖锐变化 - 输出格式:默认输出wav音频,可选mp3、m4a
- 保存到原位置:若选中,将把生成的配音音频保存到原始srt字幕文件所在位置
- 打开输出目录:点击打开生成的配音音频所在文件夹
