Skip to content

视频翻译软件的核心原理是:根据视频中的说话声音识别出文字,然后将文字翻译为目标语言文字,再将翻译后的文字进行配音,最后将配音、文字嵌入视频。

可以看到第一步就是从视频中的说话声识别出文字,识别精确度直接影响到后续翻译和配音。

使用Google识别时需注意

  1. 需要填写网络代理,不然无法连接
  2. Google的语音识别功能不强,无法区分和返回标点符号。
  3. 适合背景音干净、人声清晰准确的音频识别

使用方法

软件界面中从模式下拉框里选择 GoogleSpeech 即可。选择该项时,无需再选择模型和分割方式。

优缺点

优点:无需下载模型、节省系统资源、使用简单

缺点:需要代理、效果略差

代理问题

在使用Google Gemini等服务时,由于众所周知的原因,必须使用代理,一般形式为 http://127.0.0.1:数字端口号,如果你已确定使用了系统代理,并在浏览器里可以访问,但不知道怎么填写网络代理地址,那么执行如下命令,确认是否正确启用了系统代理。

按住 Windows键 + R键,在弹出的运行窗口中输入 ms-settings:network-proxy,然后点击确定

如果弹出的设置面板类似下图,说明已正确设置了系统代理,可以无需在软件中填写“网络代理地址”