为减小下载体积,软件不内置模型,将在第一次使用时在线下载,主要用到的模型和下载地址如下
语音识别模型、TTS模型、字幕翻译模型
从国外模型仓库下载 https://huggingface.co
例如 faster-whisper渠道 使用的模型,hugginface_asr渠道 使用的模型
ChatterBox、 Supertonic3、Qwen3-TTS、piper配音渠道,Qwen3-ASR语音识别渠道等
注意:国内无法直连该地址,将自动使用国内镜像站下载: https://hf-mirror.com
从阿里魔塔模型仓库下载 https://modelscope.cn
例如 阿里FunASR语音渠道,Firered中文、Dolphin、parakeet日语、Omnilingual ASR语音识别渠道,vits/piper/zipvoice配音渠道, M2M100翻译渠道等
说话人分离模型
- 内置模型: https://modelscope.cn/models/himyworld/videotrans/files
- reverb: https://huggingface.co/Revai/reverb-diarization-v1
- pyannote: https://huggingface.co/pyannote/speaker-diarization-3.1
- camp++: https://modelscope.cn/models/iic/speech_campplus_speaker-diarization_common
