HuggingFace_ASR 语音识别渠道模型下载
v3.91 后新增了 HuggingFace_ASR 语音识别渠道,支持使用 huggingface.co 上的这些模型用于语音识别 第一次使用某个模型会自动下载,从 https://huggingface.co 或国内镜像 https://hf-mirror.com 因墙的原因,下载很可能会失败,你也可以手动下载将文件放入对应位置,方法如下
注意下载后不要修改文件名称,如果你的下载目录已有同名文件,可能会自动创建
xxx(1)这类名称,请删除原有旧文件,然后重命名为同下载页相同名称
可以使用的模型和支持的语言
nvidia/parakeet-ctc-1.1b: 支持识别
英语发音的音视频reazon-research/japanese-wav2vec2-large-rs35kh: 支持识别
日语发音的音视频kotoba-tech/kotoba-whisper-v2.0": 支持识别
日语发音的音视频zh-plus/faster-whisper-large-v2-japanese-5k-steps: 支持识别
日语发音的音视频JhonVanced/whisper-large-v3-japanese-4k-steps-ct2: 支持识别
日语发音的音视频jonatasgrosman/wav2vec2-large-xlsr-53-japanese": 支持识别
日语发音的音视频suzii/vi-whisper-large-v3-turbo-v1:支持识别
越南语发音的音视频biodatlab/whisper-th-medium":支持识别
泰国语发音的音视频biodatlab/whisper-th-large-v3":支持识别
泰国语发音的音视频
手动下载
手动下载
nvidia/parakeet-ctc-1.1b:- 创建文件夹:在
sp.exe(sp.py)同级的models文件夹内创建models--nvidia--parakeet-ctc-1.1b文件夹并进入 - 打开模型下载地址: https://huggingface.co/nvidia/parakeet-ctc-1.1b/tree/main
- 将该页面的所有文件下载后复制到上面创建的文件夹内即可。
- 创建文件夹:在
手动下载
reazon-research/japanese-wav2vec2-large-rs35kh:- 创建文件夹:在
sp.exe(sp.py)同级的models文件夹内创建models--reazon-research--japanese-wav2vec2-large-rs35kh文件夹并进入 - 打开模型下载地址: https://huggingface.co/reazon-research/japanese-wav2vec2-large-rs35kh/tree/main
- 将该页面的所有文件下载后复制到上面创建的文件夹内即可。
- 创建文件夹:在
手动下载
kotoba-tech/kotoba-whisper-v2.0:- 创建文件夹:在
sp.exe(sp.py)同级的models文件夹内创建models--kotoba-tech--kotoba-whisper-v2.0文件夹并进入 - 打开模型下载地址: https://huggingface.co/kotoba-tech/kotoba-whisper-v2.0/tree/main
- 将该页面的所有文件下载后复制到上面创建的文件夹内即可。
- 创建文件夹:在
手动下载
zh-plus/faster-whisper-large-v2-japanese-5k-steps:- 创建文件夹:在
sp.exe(sp.py)同级的models文件夹内创建models--zh-plus--faster-whisper-large-v2-japanese-5k-steps文件夹并进入 - 打开模型下载地址: https://huggingface.co/zh-plus/faster-whisper-large-v2-japanese-5k-steps/tree/main
- 将该页面的所有文件下载后复制到上面创建的文件夹内即可。
- 创建文件夹:在
手动下载
JhonVanced/whisper-large-v3-japanese-4k-steps-ct2:- 创建文件夹:在
sp.exe(sp.py)同级的models文件夹内创建models--JhonVanced--whisper-large-v3-japanese-4k-steps-ct2文件夹并进入 - 打开模型下载地址: https://huggingface.co/JhonVanced/whisper-large-v3-japanese-4k-steps-ct2/tree/main
- 将该页面的所有文件下载后复制到上面创建的文件夹内即可。
- 创建文件夹:在
手动下载
jonatasgrosman/wav2vec2-large-xlsr-53-japanese:- 创建文件夹:在
sp.exe(sp.py)同级的models文件夹内创建models--jonatasgrosman--wav2vec2-large-xlsr-53-japanese文件夹并进入 - 打开模型下载地址: https://huggingface.co/jonatasgrosman/wav2vec2-large-xlsr-53-japanese/tree/main
- 将该页面的所有文件下载后复制到上面创建的文件夹内即可。
- 创建文件夹:在
手动下载
suzii/vi-whisper-large-v3-turbo-v1:- 创建文件夹:在
sp.exe(sp.py)同级的models文件夹内创建models--suzii--vi-whisper-large-v3-turbo-v1文件夹并进入 - 打开模型下载地址: https://huggingface.co/suzii/vi-whisper-large-v3-turbo-v1/tree/main
- 将该页面的所有文件下载后复制到上面创建的文件夹内即可。
- 创建文件夹:在
手动下载
biodatlab/whisper-th-medium:- 创建文件夹:在
sp.exe(sp.py)同级的models文件夹内创建models--biodatlab--whisper-th-medium文件夹并进入 - 打开模型下载地址: https://huggingface.co/biodatlab/whisper-th-medium/tree/main
- 将该页面的所有文件下载后复制到上面创建的文件夹内即可。
- 创建文件夹:在
手动下载
biodatlab/whisper-th-large-v3:- 创建文件夹:在
sp.exe(sp.py)同级的models文件夹内创建models--biodatlab--whisper-th-large-v3文件夹并进入 - 打开模型下载地址: https://huggingface.co/biodatlab/whisper-th-large-v3/tree/main
- 将该页面的所有文件下载后复制到上面创建的文件夹内即可。
- 创建文件夹:在
下载 openai-whisper 渠道所需模型
该渠道模型是单个的
.pt文件,下载后放到sp.py(sp.exe)同级的models文件夹内即可
large-v3-turbo.pt: https://openaipublic.azureedge.net/main/whisper/models/aff26ae408abcba5fbf8813c21e62b0941638c5f6eebfb145be0c9839262a19a/large-v3-turbo.pt
下载 faster-whisper 渠道所需模型
默认自动从
https://huggingface.co下载,该地址在国内已被屏蔽,非科学上网无法访问,国内将自动使用镜像站https://hf-mirror.com替换,但不太稳定,可能下载失败,如果失败,请手动下载,方法如下
tiny 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-tiny文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-tiny/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
tiny.en 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-tiny.en文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-tiny.en/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
base 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-base文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-base/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
base.en 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-base.en文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-base.en/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
small 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-small文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-small/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
small.en 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-small.en文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-small.en/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
medium 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-medium文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-medium/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
medium.en 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-medium.en文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-medium.en/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
large-v3-turbo 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--mobiuslabsgmbh--faster-whisper-large-v3-turbo文件夹 - 打开模型下载地址: https://huggingface.co/mobiuslabsgmbh/faster-whisper-large-v3-turbo/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
large-v1 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-large-v1文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-large-v1/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
large-v2 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-large-v2文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-large-v2/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
large-v3 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-whisper-large-v3文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-whisper-large-v3/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
distil-small.en 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-distil-whisper-small.en文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-distil-whisper-small.en/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
distil-medium.en 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-distil-whisper-medium.en文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-distil-whisper-medium.en/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
distil-large-v2 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-distil-whisper-large-v2文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-distil-whisper-large-v2/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
distil-large-v3 模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--Systran--faster-distil-whisper-large-v3文件夹 - 打开模型下载地址: https://huggingface.co/Systran/faster-distil-whisper-large-v3/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
distil-large-v3.5模型:
- 创建文件夹:在
sp.exe(sp.py)同目录下的models文件夹内创建models--distil-whisper--distil-large-v3.5-ct2文件夹 - 打开模型下载地址: https://huggingface.co/distil-whisper/distil-large-v3.5-ct2/tree/main
- 将该页面的所有 .json/.bin/.txt 文件下载后复制到上面创建文件夹内即可。
- 创建文件夹:在
下载 M2M100 翻译模型
下载地址: https://modelscope.cn/models/himyworld/videotrans/resolve/master/m2m100_12b_model.zip
解压后得到一个文件夹m2m100_12b,将该文件夹复制到 sp.py(sp.exe) 所在目录下的 models 文件夹内即可
VITS配音渠道、Piper-TTS配音渠道模型下载
VITS-TTS渠道:中文音色175个,英文音色109个,不支持其他语言配音模型下载地址:https://modelscope.cn/models/himyworld/videotrans/resolve/master/vits-tts.zip
下载后解压,会看到1个文件夹
vits,将该文件夹复制到sp.exe(源码部署为sp.py)所在目录的models文件夹内即可
Piper-TTS渠道: 支持20种语言配音,但为减小模型体积,避免下载过多不需要的模型,默认仅支持一个中文音色、10个英文音色。 模型下载地址:https://modelscope.cn/models/himyworld/videotrans/resolve/master/piper-tts.zip下载后解压,会看到1个文件夹
piper,将该文件夹复制到sp.exe(源码部署为sp.py)所在目录的models文件夹内即可
