说话人识别/分离
从 v3.85 版本后,支持说话人识别
注意:受限于当前模型性能,说话人识别并不准确
为避免软件体积过渡膨胀,并未内置说话人识别模型,如果需要该功能,请手动下载模型,解压后将.onnx和.txt文件复制到软件目录下的models/onnx 文件夹内
GitHub 下载地址 /Download from github.com
https://github.com/jianchang512/stt/releases/download/0.0/noise-uvr-speaker-realtime.7z
百度网盘下载地址 / Download from BaiduNetDisk
https://pan.baidu.com/s/1UaI0BCXeRwditx-pIy_e9A?pwd=1234
然后在软件界面中选中说话人识别复选框即可。 该复选框后边的数字是确定要识别的人数,默认不限制,如果你已知说话人,建议选择某个数字(2-10),将能提高识别准确度
