Skip to content

说话人识别/分离

从 v3.85 版本后,支持说话人识别

注意:受限于当前模型性能,说话人识别并不准确

为避免软件体积过渡膨胀,并未内置说话人识别模型,如果需要该功能,请手动下载模型,解压后将.onnx.txt文件复制到软件目录下的models/onnx 文件夹内

GitHub 下载地址 /Download from github.com

https://github.com/jianchang512/stt/releases/download/0.0/noise-uvr-speaker-realtime.7z

百度网盘下载地址 / Download from BaiduNetDisk

https://pan.baidu.com/s/1UaI0BCXeRwditx-pIy_e9A?pwd=1234

然后在软件界面中选中说话人识别复选框即可。 该复选框后边的数字是确定要识别的人数,默认不限制,如果你已知说话人,建议选择某个数字(2-10),将能提高识别准确度