原声克隆与多角色配音
一:基于视频的原声克隆
在自定义视频翻译功能中,可在配音渠道中选择 F5-TTS/GPT-SoVITS/CosyVoice/Chatterbox/clone-voice等,选中clone角色,将会以视频中原声音作为参考音频进行配音,得到原音色的配音。

主界面中角色选择 clone,就可以进行克隆音色配音了
- F5-TTS: 支持中文、英文配音
- CosyVoice: 支持 中文、英文、日文、韩文、德文、西班牙文、法文、意大利文、俄文配音
- GPT-SoVITS: 支持中文、日语、英语、韩语、粤语配音
- Chatterbox: 支持阿拉伯语、德语、英语、西班牙语、法语、希伯来语、印地语、意大利语、日语、韩语、马来语、波兰语、葡萄牙语、俄语、瑞典语、土耳其语和中文配音

设定字幕最短时长大于3s,否则克隆语音极可能出错
克隆音色会使用字幕对应的视频中原声音片段作为参考音频,因此字幕时长请保持在3s以上,否则极可能克隆出错,可通过在菜单--工具--高级选项--whisper语音识别设置中--将最短语音持续时长设为大于等于3000的值,最长语音持续时长设为大于等于8的值
二:基于字幕的多角色配音
从 v3.74 后新增了"字幕多角色配音"功能,点击左侧工具栏的字幕多角色配音按钮,在弹出的窗口中,导入需要配音的 srt 字幕,然后为每条字幕分别设置一个角色,即可实现多角色发音。

