v3.95更新日志
- 在视频翻译功能中,增加二次识别,主界面点击
设置更多参数可看到 - 菜单-工具-高级选项中增加
vad类型切换,默认ten-vad,速度更快更精准,若遇到问题可切换回silero - faster-whisper默认批量推理,以加快速度,高级选项中修改
faster-whisper批次为1,可改为非批量,速度降低但略微提高精确度 - 优化模型自动下载,先测试
huggingface.co,若失败则从国内镜像hf-mirror.com下载 - 高级选项中增加几个自定义选项,用于控制幻觉问题
- 添加
文稿对齐功能,基于faster-whisper本地模型和diff算法简单实现 - 增加
supertonic配音渠道,支持 英语、韩语、西班牙语、葡萄牙语、法语, 小巧快速 - 语音降噪改用阿里 modelscope.cn 默认,处理耗时将大幅增加,降噪效果也更佳
- 说话人分离支持 内置中英模型、pyannote3.0模型、阿里cam++中英模型、reverb-diarization-v1模型,可在高级选项中切换,默认使用内置中英模型
- 单个视频翻译时,在弹出字幕修改界面时,可打开字幕文件夹,然后手动或通过第三方工具修改已生成的字幕文件,然后在该界面点击
不保存只继续将使用已做过修改的字幕文件,用于方便自行调整字幕
