Skip to content

是否支持docker部署

不支持

能否识别视频中的字幕文字,即ocr识别

该软件原理是识别视频中的人类说话声,并转为文字字幕,不支持ocr识别字幕功能

能否通过 http api 接口调用

目前不可,后续或许会增加该功能

能否新增语言

不可,因为语音识别为字幕依赖 whisper模型,而该模型支持的语言有限,不支持的语言将无法识别

从哪里下载软件

https://pyvideotrans.com/downpackage.html

从哪里下载模型

https://pyvideotrans.com/model.html

已安装了cuda,还是无法使用

可能的原因。

1: 内置cuda支持需要11.8版本以上,检查你的cuda版本是否过低 2: 显卡驱动太旧,需要更新 3: 没有安装 cudnn 4: 显卡不是N卡或不兼容

是否支持多角色识别和配音

不支持,识别后的字幕不区分说话人和角色。可通过“设置行角色”手动实现该功能

cli命令行模式总是出问题

cli方式更新滞后,请使用旧版

翻译阶段出错

请更换翻译渠道或填写网络代理

软件双击后卡住不动 无法启动,卡在启动界面

软件体积较大,请耐心等待,如果很久仍无法打开。请尝试

  1. 关闭杀毒软件、安全软件等
  2. 确认软件所在路径和目录是英文或数字组成,不要含有空格、中文、特殊符号等

如果是覆盖了升级包后无法启动,请下载完整后。

如果已是完整包,请耐心等待。如果超出2分钟仍未启动 ,请尝试强制关闭重新打开。

都支持哪些翻译

目前支持 Microsoft微软翻译 Google翻译 百度翻译 腾讯翻译 DeepL翻译 ChatGPT翻译 AzureGPT翻译 Gemini Pro翻译 DeepLx翻译 OTT离线翻译 FreeGoogle翻译 FreeChatGPT翻译

Connection error

出现 Connection error 这个报错,说明网络连接失败,如果没有在软件界面中填写代理,请进行填写,国内是无法直连 ChatGPT/Gemini/Google等api的,需要填写代理。注意,浏览器中能打开对应网站,不代表软件中就能使用,请在网络代理输入框中填写正确的代理地址

Whole all out of memory

出现 Whole all out of memory 这个报错,说明显存不足,请使用更小点的模型,比如tiny small等

Requested float16 compute type, but the target device or backend do not support efficient float 16 computation

报错显示当前显卡不支持此种数据类型,解决方法是,打开 videotrans/set.ini文件,找到

cuda_com_type=

这行,将等号后的内容改为 int8_float16,即 cuda_com_type=int8_float16

然后重启软件执行,如果仍报错,再修改为

cuda_com_type=float32

如何安装

无需安装,下载完整包后解压,双击sp.exe 即可使用

为什么报病毒或被拦截

这是使用 pyinstaller 打包的软件,未做数字签名未做杀软认证,可能会误报,请加入信任白名单或关闭安全软件。 或者使用源码部署

都支持哪些TTS配音

edgeTTS / Azure AI / GPT-SoVITS / clone-voice / elevenlabs

源码部署问题说明

  1. 默认使用 ctranslate2的4.x版本,仅支持CUDA12.x版本,如果你的cuda低于12,并且无法升级cuda到12.x,请执行命令卸载ctranslate2然后重新安装

pip uninstall -y ctranslate2

pip install ctranslate2==3.24.0
  1. 可能会遇到 xx module not found 之类错误,请打开 requirements.txt,搜索该 xx 模块,然后将xx后的 ==及等会后的版本号去掉

有没有人工客服

没有,这是免费软件,没有收入没有盈利,无法配备人工客服

是否收费

这是一个免费并且开源的项目,不收取任何费用,免费使用。翻译和tts接口是各自api商家收费,与该项目无关

可否商用

个人或公司都可随便使用。但如果要集成到商业项目中,请遵循 GPL-v3 开源协议