Skip to content

高级设置各个选项说明

在顶部菜单--工具/选项--高级选项 中可对一些参数进行自定义,以便实现更精细的控制。如下图。

【通用设置】

  • 软件界面语言: 设置软件界面语言,修改后需要重启软件

  • 单视频翻译暂停倒计时: 当单个视频翻译时,暂停倒计时秒数

  • 设置输出目录: 用于保存视频分离、字幕配音、字幕翻译等结果的位置,默认软件安装目录下output文件夹

  • LLM重新断句每批字幕行数: LLM大模型重新断句时,每次发送多少条字幕,该值越大断句效果越好,一次性发送全部字幕最佳,但受限于最大输出token和上 下文(max_token),过长输入可能导致超出AI限制而失败,默认20条字幕

  • LLM重新断句所用AI渠道: LLM重新断句时使用的AI渠道,目前支持openai或deepseek渠道

  • Gemini语音识别每批切片数: 使用gemini识别语音时,每次发送音频切片数,越大效果越好,但失败率会升高

  • 禁用桌面通知: 任务完成或失败后不显示桌面通知

  • 批量翻译时强制串行: 批量翻译时,默认分为7个阶段同时并行翻译,选中此处,将按顺序一个个翻译

  • 主界面显示所有参数?: 为避免过多参数造成困扰,主界面默认隐藏大部分参数,如果选中这里将切换为默认显示所有参数

  • 最大进程数: 最大进程数,越大越快但可能爆内存,最大不应超过cpu核数减一

  • GPU同时任务数[重启生效]: GPU任务同时执行数量,除非单卡显存大于20G,否则请设为1 (修改保存后重启生效)

  • 多显卡模式[重启生效]: 如果有多张显卡,且显存一致,可启用该项,同时可将上述选项设为2或显卡数 (修改保存后重启生效)

【视频输出控制】

  • 视频输出质量控制: 视频转码时损失控制,0=无损但视频会超级大,51=质量差文件小,默认23质量和尺寸适中

  • 输出视频压缩率: 主要调节编码速度和质量的平衡,有 ultrafast、superfast、veryfast、faster、fast、medium、slow、slower、veryslow 选项,编码速 度从快到慢、压缩率从低到高、视频尺寸从大到小。

  • 自定义ffmpeg命令参数: 自定义ffmpeg命令参数, 将添加在倒数第二个位置上,例如 -bf 7 -b_ref_mode middle

  • 强制软编码视频?: 强制软件编码?(速度慢但兼容性好不易出错,默认优选硬件编码)

  • 264/265编码: 采用 libx264 编码或 libx265 编码,264兼容性更好,265压缩比更大清晰度更高

【字幕翻译调整】

  • 传统翻译渠道每批字幕行数: 传统翻译渠道每次发送字幕行数

  • AI翻译渠道每批字幕行数: AI翻译渠道每次发送字幕行数

  • 翻译后暂停秒: 每次翻译后暂停秒数,用于限制请求频率

  • 发送完整字幕: 是否在使用AI翻译渠道时发送完整字幕格式内容

  • AI翻译模型温度值: AI翻译模型温度值,默认0.2

  • AI翻译附带完整原字幕: 附带完整原字幕作为AI上下文信息,翻译质量将更高 【务必注意】1. 必须使用支持超长上下文的先进模型╗. token消耗量将增加数倍

【配音调整】

  • 并发配音线程数: 同时配音的线程数

  • 配音后暂停秒: 每次配音后暂停秒数,用于限制请求频率

  • 保留每条字幕的配音文件: 保留每行字幕的配音结果

  • AzureTTS批量行数: Azure TTS批量配音行数,一次多少行

  • ChatTTS音色值: ChatTTS 音色值

  • EdgeTTS配音渠道配音并发数: EdgeTTS渠道配音并发数,越大越快,但可能限流失败

  • EdgeTTS配音渠道失败重试次数: EdgeTTS渠道失败后重试次数,有些失败无论多少次重试也无法恢复,太大只会延长耗时

【字幕声音画面对齐】

  • 音频加速最大倍数: 最大音频加速倍数,默认100

  • 视频慢放最大倍数: 视频慢放最大倍数,默认10,不可大于10

  • 中日韩字幕单行字符数: 中日韩字幕单行字符数,多于将换行,仅针对视频翻译中的目标字幕或单独的语音转录功能字幕

  • 其他语言字幕单行字符数: 其他语言字幕单行字符数,多于将换行,仅针对视频翻译中的目标字幕或单独的语音转录功能字幕

【语音识别参数调整】

  • 语音阈值: 表示音频片段被认为是语音的最低概率。VAD 会为每个音频片段计算语音概率,超过此阈值的部分被视为语音,反之视为静音或噪音。 默认0.5,越小越灵敏但可能误将噪声视为语音

  • 最长语音持续秒数: 限制单个语音片段的最大长度。超过此时长时强制分割。填写数字,单位是秒,默认8秒

  • 静音分割持续毫秒数: 在语音结束时,需等待的静音时间达到此值后,才会分割出语音片段。填写数字,单位ms,默认500ms 也就是只在大于此值的静音片段处分割

  • 最短字幕时长毫秒: 如果某条字幕时长小于该值对应ms,则尝试将该字幕合并进相邻字幕中,默认1000ms

  • 合并过短字幕到邻近: 只有选中该项,才会合并短字幕

  • 选择VAD: 选择要使用的VAD

  • no speech threshold: 减小可降低幻觉但可能遗漏文字

  • 采样温度: 采样温度

  • 热词: 告诉模型哪些词可能出现,以英文逗号分隔多个

  • 重复惩罚: 增大该值有利于减少重复

  • 文本压缩率: 减小该值有利于减少重复

  • faster-whisper批次大小: faster-whisper模型识别时批次大小,越大越快但所需显存越多,太大可能爆显存 设为1能略微提升准确度

  • 说话人分离模型: 用于说话人分离的模型,默认内置模型支持中英. 若选 pyannote 必须拥有 https://huggingface.co 上的token, 并且同意pyannote组织的授权协议

具体请访问URL查看教程: https://pvt9.com/shuohuaren

  • Huggingface的token: 填写你在 huggingface.co 的token,否则无法使用 pyannote,具体查看教程 https://pvt9.com/shuohuaren

  • faster/whisper模型: faster模式和openai模式下的模型名字列表,英文逗号分隔

  • whisper.cpp模型: whisper.cpp模式下的模型名字列表,英文逗号分隔

  • CUDA数据类型: faster模式时cuda数据类型,int8=消耗资源少,速度快,精度低,float32=消耗资源多,速度慢,精度高,float16适合GPU加速。default默 认自选

  • 识别准确度beam_size: 字幕识别时精度调整,1-5,1=消耗显存最低,5=消耗显存最多

  • 识别准确度best_of: 字幕识别时精度调整,1-5,1=消耗显存最低,5=消耗显存最多

  • 启用上下文感知: 若开启将占用更多GPU,效果也更好,但也容易出现重复或幻觉

  • 人声背景分离线程数: 人声背景声分离线程数,越大越快但占用资源越多

  • 字幕繁体转简体: 强制将识别出的繁体字幕转为简体

【Whisper模型提示词】

  • whisper模型简体中文提示词: 发音语言为简体中文时发送给whisper模型的提示词

  • whisper模型繁体中文提示词: 发音语言为繁体中文时发送给whisper模型的提示词

  • whisper模型英语提示词: 发音语言为英语时发送给whisper模型的提示词

  • whisper模型法语提示词: 发音语言为法语时发送给whisper模型的提示词

  • whisper模型德语提示词: 发音语言为德语时发送给whisper模型的提示词

  • whisper模型日语提示词: 发音语言为日语时发送给whisper模型的提示词

  • whisper模型韩语提示词: 发音语言为韩语时发送给whisper模型的提示词

  • whisper模型俄语提示词: 发音语言为俄语时发送给whisper模型的提示词

  • whisper模型西班牙语提示词: 发音语言为西班牙语时发送给whisper模型的提示词

  • whisper模型泰国语提示词: 发音语言为泰国语时发送给whisper模型的提示词

  • whisper模型意大利语提示词: 发音语言为意大利语时发送给whisper模型的提示词

  • whisper模型葡萄牙语提示词: 发音语言为葡萄牙语时发送给whisper模型的提示词

  • whisper模型越南语提示词: 发音语言为越南语时发送给whisper模型的提示词

  • whisper模型阿拉伯语提示词: 发音语言为阿拉伯语时发送给whisper模型的提示词

  • whisper模型土耳其语提示词: 发音语言为土耳其语时发送给whisper模型的提示词

  • whisper模型印度语提示词: 发音语言为印度语时发送给whisper模型的提示词

  • whisper模型匈牙利语提示词: 发音语言为匈牙利语时发送给whisper模型的提示词

  • whisper模型乌克兰语提示词: 发音语言为乌克兰语时发送给whisper模型的提示词

  • whisper模型印尼语提示词: 发音语言为印尼语时发送给whisper模型的提示词

  • whisper模型马来语提示词: 发音语言为马来西亚语时发送给whisper模型的提示词

  • whisper模型哈萨克语提示词: 发音语言为哈萨克语时发送给whisper模型的提示词

  • whisper模型捷克语提示词: 发音语言为捷克语时发送给whisper模型的提示词

  • whisper模型波兰语提示词: 发音语言为波兰语时发送给whisper模型的提示词

  • whisper模型荷兰语提示词: 发音语言为荷兰语时发送给whisper模型的提示词

  • whisper模型瑞典语提示词: 发音语言为瑞典语时发送给whisper模型的提示词

  • whisper模型希伯来语提示词: 发音语言为瑞典语时发送给whisper模型的提示词

  • whisper模型孟加拉语提示词: 发音语言为瑞典语时发送给whisper模型的提示词

  • whisper模型波斯语提示词: 发音语言为波斯语时发送给whisper模型的提示词

  • whisper模型乌尔都语提示词: 发音语言为乌尔都语时发送给whisper模型的提示词

  • whisper模型粤语提示词: 发音语言为粤语时发送给whisper模型的提示词

  • whisper模型菲律宾语提示词: 发音语言为菲律宾语时发送给whisper模型的提示词