Skip to content

HuggingFace_ASR 语音识别渠道

v3.91 后新增了 HuggingFace_ASR 语音识别渠道,支持使用 huggingface.co 上的这些模型用于语音识别

可以使用的模型和支持的语言

  • parakeet-ctc-1.1b: 支持识别 英语 发音的音视频
  • moonshine-base-ar: 支持识别 阿拉伯语 发音的音视频
  • moonshine-base-zh: 支持识别 中文 发音的音视频
  • moonshine-base: 支持识别 英语 发音的音视频
  • moonshine-base-ja: 支持识别 日语 发音的音视频
  • moonshine-base-ko: 支持识别 韩语 发音的音视频
  • moonshine-base-es: 支持识别 西班牙语 发音的音视频
  • moonshine-base-uk: 支持识别 乌克兰语 发音的音视频
  • moonshine-base-vi: 支持识别 越南语 发音的音视频

自动和手动下载模型

第一次使用某个模型会自动下载,从 https://huggingface.co 或国内镜像 https://hf-mirror.com 因墙的原因,下载很可能会失败,你也可以手动下载将文件放入对应位置,方法如下

注意下载后不要修改文件名称,如果你的下载目录已有同名文件,可能会自动创建xxx(1)这类名称,请删除原有旧文件,然后重命名为同下载页相同名称

  • 手动下载parakeet-ctc-1.1b:

    1. 创建文件夹:在 sp.exe(sp.py) 同目录下的 models 文件夹内创建models--nvidia--parakeet-ctc-1.1b 文件夹
    2. 打开模型下载地址: https://huggingface.co/nvidia/parakeet-ctc-1.1b/tree/main
    3. 将该页面的所有 .json 和 model.safetensors 文件下载后复制到上面创建文件夹models/models--nvidia--parakeet-ctc-1.1b内即可。
  • moonshine-base-ar:支持识别阿拉伯语发音的音视频

    1. 创建文件夹:在 sp.exe(sp.py) 同目录下的 models 文件夹内创建models--UsefulSensors--moonshine-base-ar 文件夹
    2. 打开模型下载地址: https://huggingface.co/UsefulSensors/moonshine-base-ar/tree/main
    3. 将该页面的所有 .json 和 model.safetensors 文件下载后复制到上面创建文件夹models/models--UsefulSensors--moonshine-base-ar内即可。
  • moonshine-base-zh:支持识别中文发音的音视频

    1. 创建文件夹:在 sp.exe(sp.py) 同目录下的 models 文件夹内创建models--UsefulSensors--moonshine-base-zh 文件夹
    2. 打开模型下载地址: https://huggingface.co/UsefulSensors/moonshine-base-zh/tree/main
    3. 将该页面的所有 .json 和 model.safetensors 文件下载后复制到上面创建文件夹models/models--UsefulSensors--moonshine-base-zh内即可。
  • moonshine-base:支持识别英语发音的音视频

    1. 创建文件夹:在 sp.exe(sp.py) 同目录下的 models 文件夹内创建models--UsefulSensors--moonshine-base 文件夹
    2. 打开模型下载地址: https://huggingface.co/UsefulSensors/moonshine-base/tree/main
    3. 将该页面的所有 .json 和 model.safetensors 文件下载后复制到上面创建文件夹models/models--UsefulSensors--moonshine-base内即可。
  • moonshine-base-ja:支持识别日语发音的音视频

    1. 创建文件夹:在 sp.exe(sp.py) 同目录下的 models 文件夹内创建models--UsefulSensors--moonshine-base-ja 文件夹
    2. 打开模型下载地址: https://huggingface.co/UsefulSensors/moonshine-base-ja/tree/main
    3. 将该页面的所有 .json 和 model.safetensors 文件下载后复制到上面创建文件夹models/models--UsefulSensors--moonshine-base-ja内即可。
  • moonshine-base-ko:支持识别韩语发音的音视频

    1. 创建文件夹:在 sp.exe(sp.py) 同目录下的 models 文件夹内创建models--UsefulSensors--moonshine-base-ko 文件夹
    2. 打开模型下载地址: https://huggingface.co/UsefulSensors/moonshine-base-ko/tree/main
    3. 将该页面的所有 .json 和 model.safetensors 文件下载后复制到上面创建文件夹models/models--UsefulSensors--moonshine-base-ko内即可。
  • moonshine-base-es:支持识别西班牙语发音的音视频

    1. 创建文件夹:在 sp.exe(sp.py) 同目录下的 models 文件夹内创建models--UsefulSensors--moonshine-base-es 文件夹
    2. 打开模型下载地址: https://huggingface.co/UsefulSensors/moonshine-base-es/tree/main
    3. 将该页面的所有 .json 和 model.safetensors 文件下载后复制到上面创建文件夹models/models--UsefulSensors--moonshine-base-es内即可。
  • moonshine-base-uk:支持识别乌克兰语发音的音视频

    1. 创建文件夹:在 sp.exe(sp.py) 同目录下的 models 文件夹内创建models--UsefulSensors--moonshine-base-uk 文件夹
    2. 打开模型下载地址: https://huggingface.co/UsefulSensors/moonshine-base-uk/tree/main
    3. 将该页面的所有 .json 和 model.safetensors 文件下载后复制到上面创建文件夹models/models--UsefulSensors--moonshine-base-uk内即可。
  • moonshine-base-vi:支持识别越南语语发音的音视频

    1. 创建文件夹:在 sp.exe(sp.py) 同目录下的 models 文件夹内创建models--UsefulSensors--moonshine-base-vi 文件夹
    2. 打开模型下载地址: https://huggingface.co/UsefulSensors/moonshine-base-vi/tree/main
    3. 将该页面的所有 .json 和 model.safetensors 文件下载后复制到上面创建文件夹models/models--UsefulSensors--moonshine-base-vi内即可。