在软件中使用 HuggingFace 模型：详细指南 | pyVideoTrans官网-开源免费视频翻译配音软件 pyvideotrans.com pyvideotrans github github.com/jianchang512/pyvideotrans

在软件中使用 Hugging Face 模型：详细指南

Hugging Face (huggingface.co) 是一个广受欢迎的机器学习模型仓库，其中包含了大量可用的语音识别模型。当内置的 Faster-Whisper 模型在处理小语种时支持不足，或您需要特定优化模型时，Hugging Face 将是寻找解决方案的理想平台。

本功能适用于软件 v3.71 及以上版本，并仅支持由 ctranslate2 转换而来的模型。

在使用 Hugging Face 模型之前，您必须确认该模型已通过 ctranslate2 转换。如果模型未经过 ctranslate2 转换，则无法在软件中使用。

以下是几种检查方法：

1. 页面明确标注

如果模型页面明确显示“Converted from ctranslate2”或类似字样，则该模型兼容。

如图明确说明了是由ctranslate2转换而来如图所示，页面明确写明使用 ctranslate2 转换，则该模型可用。

2. 检查代码引用

即使页面没有明确说明，您也可以查看模型页面中是否包含 from faster_whisper 相关的代码片段。通常，这类模型也兼容。查看模型页面中示例代码中是否包含 from faster_whisper

3. 查看 config.json 文件结构

如果以上两种方法都无法确定，您可以点击模型页面中的 Files and versions 标签页，然后找到并点击 config.json 文件。

点击文件列表，查看config.json结构

如果 config.json 文件的结构类似下图，例如文件开头包含 alignment_heads，并且中间包含 lang_ids 等字段，则该模型通常也兼容。

结构中由alignment_heads和lang_ids等

一旦确认模型兼容，您就可以将其添加到软件中使用了。

1. 获取模型 ID

模型 ID 由两部分组成，用 / 分隔：用户名/模型名称。例如：zh-plus/faster-whisper-large-v2-japanese-5k-steps。

您可以在模型详情页找到并点击复制按钮直接获取模型 ID，如下图所示：

可到达模型详情页直接点击复制id

2. 将模型 ID 添加到软件

用英文逗号隔开粘贴

返回软件主界面。
在 语音识别 下拉列表中选择 faster-whisper (本地)。
在右侧的 模型 下拉列表中，选择您刚刚添加的模型 ID。软件将自动从国内镜像站点 https://hf-mirror.com 下载该模型，无需科学上网。

1. 模型可用性限制

软件仅支持下载 Hugging Face 上公开可用的模型。对于需要您同意条款（如接受许可协议）才能下载的模型（如下图所示）以及私有模型，软件无法下载和使用。

非公共模型不可下载

2. 国内镜像站点的使用