Skip to content

菜单栏--帮助/关于 中有很多链接,比如模型下载地址、CUDA配置等,遇到问题时可尝试点开使用。

image.png

1. 双击 sp.exe 后打不开

软件是基于pyside6开发的,主界面用到的Qt组件有点多,加载可能较慢,时间从5s到2分钟不等,请耐心等待。

若是数分钟内仍未完整显示,也没显示启动画面,而仅显示一个黑色窗口,那可能是程序出错了,请检查控制台是否有报错,预打包版请检查是否仅仅下载了升级包,如果是请下载完整包。

如果尝试了所有方法并等待了很久仍是无法打开,请打开logs文件夹内的最新log文件,查看报错信息,或将该文件提交到 GitHub Isue 或 到 bbs.pyvideotrans.com 提问并上传该文件。

2. 视频清晰度降低了

翻译过程中有些操作会涉及到转码,转码必然会存在质量损失,如果你想最大化降低损失,可进行如下操作

  1. 原始视频使用 libx264编码的mp4视频
  2. 菜单--工具--高级设置中将进行如图设置

image.png

3. 翻译阶段出错

在识别出字幕后,进行翻译过程中出现红色报错,这种情况一般是“网络连接错误”或者所用翻译渠道的“账号问题”。

如果你使用的翻译渠道的“Google”、“Microsoft”、“Gemini”等,那么大概率是网络连接问题,你需要开启科学上网,并在网络代理地址文本框中填写“科学上网工具”中提供的网络代理地址。

如果你已科学上网,仍报网络连接错误,可能你的代理不可用,请正确填写科学工具中提供的http代理ip和端口号。

若确定代理可用,仍然报错,大概率是账号不可用,比如 Gemini 不是在所有国家均可用,可以尝试切换代理节点到其他国家试试。

Gemini、ChatGPT、AzureGPT渠道一般都有请求频率限制,排除网络问题和账号问题,可能是请求频率超过了限制,此时可以打开 菜单--工具--高级设置,将“翻译后暂停时间/s”设为30或更大的数字。

image.png

3. 语音识别精度太低

  1. faster模式和openai模式时,使用更大的模型能提高准确度,tiny是小模型,识别效果较差,large-v3是最大的模型,识别效果也最好,所有模型下载地址 https://pyvideotrans.com/model
  2. 如果原始视频是中文发音,可尝试使用 zh_recogn,效果更好,使用说明 https://pyvideotrans.com/zh_recogn.html
  3. 选中“保留背景音”,将提前去噪,识别效果更好,但注意如果视频很大,请勿选中。

image.png

4. 模型下载地址

模型下载地址 https://pyvideotrans.com/model

5. Win7上是否可用

不支持win7系统

6. 提示缺少 python310.dll

可能你只下载了升级补丁包,补丁包不可单独使用,请先下载1.9G的完整包,解压后可再下载补丁包覆盖。

7. 合并阶段出错ffprobe {}

很可能是原始视频名字中的空格或者单双引号导致的,尝试重命名原始视频,例如原始名字是D:/UNSW/2024 T2/BIOS 2061/Week 5 Amphibians, reptiles, and birds/_video_out/BIOS2061-5246_00069- Lecture 13 - Birds 1 'Origin of Birds' - Prof. Richard Kingsford- Part 2 - UNSW##BIOS2061-5246_00069- Lecture 13 - Birds 1 'Origin of Birds' - Prof. Richard Kingsford- Part 2 - UNSW.mp4,可以看到视频名字很复杂,存在空格、单引号等,这种名字在处理时非常容易出错,请删除空格、单引号。

image.png

是否支持docker部署

不支持

能否识别视频中的字幕文字,即ocr识别

该软件原理是识别视频中的人类说话声,并转为文字字幕,不支持ocr识别字幕功能

能否通过 http api 接口调用

目前不可,后续或许会增加该功能

能否新增语言

不可,因为语音识别为字幕依赖 whisper模型,而该模型支持的语言有限,不支持的语言将无法识别

从哪里下载软件

https://pyvideotrans.com/downpackage.html

从哪里下载模型

https://pyvideotrans.com/model.html

已安装了cuda,还是无法使用

可能的原因。

1: 内置cuda支持需要11.8版本以上,检查你的cuda版本是否过低 2: 显卡驱动太旧,需要更新 3: 没有安装 cudnn 4: 显卡不是N卡或不兼容

是否支持多角色识别和配音

不支持,识别后的字幕不区分说话人和角色。可通过“设置行角色”手动实现该功能

cli命令行模式总是出问题

cli方式更新滞后,请使用旧版

翻译阶段出错

请更换翻译渠道或填写网络代理

软件双击后卡住不动 无法启动,卡在启动界面

软件体积较大,请耐心等待,如果很久仍无法打开。请尝试

  1. 关闭杀毒软件、安全软件等
  2. 确认软件所在路径和目录是英文或数字组成,不要含有空格、中文、特殊符号等

如果是覆盖了升级包后无法启动,请下载完整后。

如果已是完整包,请耐心等待。如果超出2分钟仍未启动 ,请尝试强制关闭重新打开。

都支持哪些翻译

目前支持 Microsoft微软翻译 Google翻译 百度翻译 腾讯翻译 DeepL翻译 ChatGPT翻译 AzureGPT翻译 Gemini Pro翻译 DeepLx翻译 OTT离线翻译 FreeGoogle翻译 FreeChatGPT翻译

Connection error

出现 Connection error 这个报错,说明网络连接失败,如果没有在软件界面中填写代理,请进行填写,国内是无法直连 ChatGPT/Gemini/Google等api的,需要填写代理。注意,浏览器中能打开对应网站,不代表软件中就能使用,请在网络代理输入框中填写正确的代理地址

Whole all out of memory

出现 Whole all out of memory 这个报错,说明显存不足,请使用更小点的模型,比如tiny small等

Requested float16 compute type, but the target device or backend do not support efficient float 16 computation

报错显示当前显卡不支持此种数据类型,解决方法是,打开 菜单--工具--高级设置,找到

CUDA数据类型

这行,将内容改为 int8_float16

然后重启软件执行,如果仍报错,再修改为

float32

如何安装

无需安装,下载完整包后解压,双击sp.exe 即可使用

为什么报病毒或被拦截

这是使用 pyinstaller 打包的软件,未做数字签名未做杀软认证,可能会误报,请加入信任白名单或关闭安全软件。 或者使用源码部署

都支持哪些TTS配音

edgeTTS / Azure AI / GPT-SoVITS / clone-voice / elevenlabs

源码部署问题说明

  1. 默认使用 ctranslate2的4.x版本,仅支持CUDA12.x版本,如果你的cuda低于12,并且无法升级cuda到12.x,请执行命令卸载ctranslate2然后重新安装

pip uninstall -y ctranslate2

pip install ctranslate2==3.24.0
  1. 可能会遇到 xx module not found 之类错误,请打开 requirements.txt,搜索该 xx 模块,然后将xx后的 ==及等会后的版本号去掉

有没有人工客服

没有,这是免费软件,没有收入没有盈利,无法配备人工客服

是否收费

这是一个免费并且开源的项目,不收取任何费用,免费使用。翻译和tts接口是各自api商家收费,与该项目无关

可否商用

个人或公司都可随便使用。但如果要集成到商业项目中,请遵循 GPL-v3 开源协议