视频翻译配音pyVideoTrans | 视频翻译配音pyVideoTrans

faster 和 openai 和 GoogleSpeech 模式的区别

这3个模式都是用于将视频中的人类说话声识别为字幕。

openai-whisper更稳定、对环境要求更低使用简单，但速度慢消耗GPU显存多。
faster-whisper速度快、消耗GPU更少，但安装麻烦，除了cuda还需要安装cudnn cublasxx.dll。
GoogleSpeech 模式使用google的免费识别接口进行语音识别转为字幕，无需本地模型，但需要填写网络代理

当然这一切的前提是拥有英伟达显卡，如果计算机压根没有英伟达显卡，或者有，但不想或不会安装cuda，那么faster和openai两者使用任意一个都可以，因为不使用cuda加速的情况下，仅在cpu上运算，二者对环境没啥要求，下载即用，速度也都是一样的慢。

GoogleSpeech 模式免费使用，但效果不佳，并且无法区分标点符号，在要求不高并且有代理的情况下可以使用