Skip to content

使用已有的 SRT 字幕和人声背景声

如果您已经翻译好了 SRT 字幕,或者已经分离好了人声和背景声,可以直接导入使用,跳过软件自动生成的步骤。


一、导入已有 SRT 字幕

前置准备

  1. 规范文件名:由于底层工具对中文、空格、特殊符号兼容性较差,建议将视频文件名改为简单的英文字母、数字、下划线组合(如 myvideo.mp4

  2. 开启系统扩展名显示

    • Win10:打开文件夹 → 点击「查看」→ 勾选「文件扩展名」
    • Win11:打开文件夹 → 点击「查看」→「显示」→ 勾选「文件扩展名」

具体步骤

假设视频文件名为 myvideo.mp4,目标是从英文翻译至中文。

步骤 1:在视频文件所在的同级目录下,创建一个名为 _video_out 的文件夹。

步骤 2:进入 _video_out 文件夹,创建一个视频同名且带格式后缀的子文件夹:

_video_out/myvideo-mp4/

⚠️ v3.87 及以后版本必须带有后缀,格式为 [文件名]-[视频格式],例如 myvideo-mp4video1-avi

步骤 3:将准备好的两种语言字幕文件复制到子文件夹内,并重命名为标准的语言代码:

_video_out/myvideo-mp4/en.srt      ← 源语言字幕(英文)
_video_out/myvideo-mp4/zh-cn.srt   ← 目标语言字幕(中文)

步骤 4:回到软件主界面,导入该视频并执行翻译。软件检测到 _video_out 内的对应字幕后,将跳过 ASR 和翻译阶段,直接进入配音与合成阶段。


二、导入外部人声和背景声

由于软件内置的人声分离采用纯 CPU 计算,速度极慢。建议使用专业第三方工具(如 UVR5-GUI)在 GPU 加速下进行分离:

步骤 1:使用第三方工具将音频分离为:

  • 人声文件(Vocal):无背景音的人声
  • 伴奏文件(Instrumental):无干声的伴奏

输出格式必须为 wav

步骤 2:将文件重命名:

vocal.wav       ← 人声
instrument.wav  ← 伴奏

步骤 3:将这两个文件复制到 _video_out/myvideo-mp4/ 文件夹内。

步骤 4:软件在处理该视频时将直接读取这两个文件,人声识别率会大幅提高,且省去了分离耗时。


三、语言代码参考

语言代码语言代码
英语en中文(简体)zh-cn
中文(繁体)zh-tw日语ja
韩语ko法语fr
德语de西班牙语es
俄语ru葡萄牙语pt
意大利语it阿拉伯语ar
土耳其语tr越南语vi
印地语hi泰语th
波兰语pl荷兰语nl
瑞典语sv希腊语el
印尼语id马来语ms