Skip to content

v3.95更新日志

  1. 在视频翻译功能中,增加二次识别,主界面点击设置更多参数可看到
  2. 菜单-工具-高级选项中增加vad类型切换,默认 ten-vad,速度更快更精准,若遇到问题可切换回 silero
  3. faster-whisper默认批量推理,以加快速度,高级选项中修改faster-whisper批次为1,可改为非批量,速度降低但略微提高精确度
  4. 优化模型自动下载,先测试huggingface.co,若失败则从国内镜像hf-mirror.com下载
  5. 高级选项中增加几个自定义选项,用于控制幻觉问题
  6. 添加 文稿对齐 功能,基于 faster-whisper本地模型和diff算法简单实现
  7. 增加 supertonic 配音渠道,支持 英语、韩语、西班牙语、葡萄牙语、法语, 小巧快速
  8. 语音降噪改用阿里 modelscope.cn 默认,处理耗时将大幅增加,降噪效果也更佳
  9. 说话人分离支持 内置中英模型、pyannote3.0模型、阿里cam++中英模型、reverb-diarization-v1模型,可在高级选项中切换,默认使用内置中英模型
  10. 单个视频翻译时,在弹出字幕修改界面时,可打开字幕文件夹,然后手动或通过第三方工具修改已生成的字幕文件,然后在该界面点击不保存只继续将使用已做过修改的字幕文件,用于方便自行调整字幕
  11. 支持多显卡并发,加快处理速度,可在高级选项中选中多显卡模式
  12. 重型任务改用多进程方式,以便更好利用多核,可在高级选项中--填写更大数量的最大进程数加快速度
  13. 高级选项-字幕翻译-增加附带完整字幕复选框,选中后并且使用AI翻译渠道时,将把原始字幕一并发给ai,可取得更好的翻译质量
  14. 增加命令行模式,具体使用方法查看 cli命令行
  15. 优化默认翻译提示词
  16. 增加对 qwen-tts 开源模型支持