高级设置各个选项说明

在顶部菜单--工具/选项--高级选项中可对一些参数进行自定义，以便实现更精细的控制。如下图。

【通用设置】

软件界面语言: 设置软件界面语言，修改后需要重启软件
单视频翻译暂停倒计时: 当单个视频翻译时，暂停倒计时秒数
设置输出目录: 用于保存视频分离、字幕配音、字幕翻译等结果的位置，默认软件安装目录下output文件夹
LLM重新断句每批字幕行数: LLM大模型重新断句时，每次发送多少条字幕，该值越大断句效果越好，一次性发送全部字幕最佳，但受限于最大输出token和上下文(max_token)，过长输入可能导致超出AI限制而失败，默认20条字幕
LLM重新断句所用AI渠道: LLM重新断句时使用的AI渠道，目前支持openai或deepseek渠道
Gemini语音识别每批切片数: 使用gemini识别语音时，每次发送音频切片数，越大效果越好，但失败率会升高
禁用桌面通知: 任务完成或失败后不显示桌面通知
批量翻译时强制串行: 批量翻译时，默认分为7个阶段同时并行翻译，选中此处，将按顺序一个个翻译
主界面显示所有参数?: 为避免过多参数造成困扰，主界面默认隐藏大部分参数，如果选中这里将切换为默认显示所有参数
最大进程数[重启生效]: 最大进程数，越大越快但可能爆内存，最大不应超过cpu核数减一，(修改保存后重启生效)
GPU同时任务数[重启生效]: GPU任务同时执行数量，除非单卡显存大于20G，否则请设为1，(修改保存后重启生效)
多显卡模式[重启生效]: 如果有多张显卡，且显存一致，可启用该项，同时可将上述选项设为2或显卡数，(修改保存后重启生效)

【视频输出控制】

视频输出质量控制: 视频转码时损失控制，0=无损但视频会超级大，51=质量差文件小
输出视频压缩率: 主要调节编码速度和质量的平衡，有 ultrafast、superfast、veryfast、faster、fast、medium、slow、slower、veryslow 选项，编码速度从快到慢、压缩率从低到高、视频尺寸从大到小。
自定义ffmpeg命令参数: 自定义ffmpeg命令参数，将添加在倒数第二个位置上,例如 -bf 7 -b_ref_mode middle
强制软编码视频?: 强制软件编码?（速度慢但兼容性好不易出错，默认优选硬件编码）
视频合成优先硬编码: 视频合成时优先尝试硬编码，速度快但可能出错
264/265编码: 采用 libx264 编码或 libx265 编码，264兼容性更好，265压缩比更大清晰度更高

【字幕翻译调整】

传统翻译渠道每批字幕行数: 传统翻译渠道每次发送字幕行数
AI翻译渠道每批字幕行数: AI翻译渠道每次发送字幕行数
翻译后暂停秒: 每次翻译后暂停秒数,用于限制请求频率
发送完整字幕: 是否在使用AI翻译渠道时发送完整字幕格式内容
AI翻译模型温度值: AI翻译模型温度值，默认0.2
AI翻译附带完整原字幕: 附带完整原字幕作为AI上下文信息，翻译质量将更高，【务必注意】1. 必须使用支持超长上下文的先进模型. token消耗量将增加数倍

【字幕配音调整】

并发配音线程数: 同时配音的线程数
配音后暂停秒: 每次配音后暂停秒数,用于限制请求频率
移除配音前后静音缓冲: 移除每条字幕配音前后静音缓冲，利于音画同步，但可能结尾仓促
保留每条字幕的配音文件: 保留每行字幕的配音结果
AzureTTS批量行数: Azure TTS批量配音行数，一次多少行
ChatTTS音色值: ChatTTS 音色值
EdgeTTS配音渠道配音并发数: EdgeTTS渠道配音并发数，越大越快，但可能限流失败
EdgeTTS配音渠道失败重试次数: EdgeTTS渠道失败后重试次数,有些失败无论多少次重试也无法恢复，太大只会延长耗时

【字幕声音画面对齐】

音频加速最大倍数: 最大音频加速倍数，默认100
视频慢放最大倍数: 视频慢放最大倍数，默认10，不可大于10
中日韩字幕单行字符数: 中日韩字幕单行字符数，多于将换行，仅针对视频翻译中的目标字幕或单独的语音转录功能字幕
其他语言字幕单行字符数: 其他语言字幕单行字符数，多于将换行，仅针对视频翻译中的目标字幕或单独的语音转录功能字幕

【语音识别参数】

语音阈值: 表示音频片段被认为是语音的最低概率。VAD 会为每个音频片段计算语音概率，超过此阈值的部分被视为语音，反之视为静音或噪音。越小越灵敏但可能误将噪声视为语音
最长语音持续秒数: 限制单个语音片段的最大长度。超过此时长时强制分割。填写数字，单位是秒
最短语音持续毫秒: 最短语音持续的时长，如果某条字幕时长小于该值对应ms，则尝试将该字幕合并进相邻字幕中，单位是毫秒
合并过短字幕到邻近: 只有选中该项，才会合并短字幕
静音分割持续毫秒: 在语音结束时，需等待的静音时间达到此值后，才会分割出语音片段。填写数字，单位ms，也就是只在大于此值的静音片段处分割
选择VAD: 选择要使用的VAD
no speech threshold: 减小可降低幻觉但可能遗漏文字
采样温度: 采样温度
热词: 告诉模型哪些词可能出现，以英文逗号分隔多个
重复惩罚: 增大该值有利于减少重复
文本压缩率: 减小该值有利于减少重复
Whisper预分割音频?: 是否提前将音频切割为句子片段后再发给whisper模型识别?若使用clone配音角色，请选中，并将最短语音设为3000，最大语音设为10，提供语音克隆可靠性
说话人分离模型: 用于说话人分离的模型，默认内置模型支持中英. 若选 pyannote 必须拥有 https://huggingface.co 上的token，并且同意pyannote组织的授权协议，具体请访问URL查看教程: https://pvt9.com/shuohuaren
Huggingface的token: 填写你在 huggingface.co 的token，否则无法使用 pyannote，具体查看教程 https://pvt9.com/shuohuaren
faster/whisper模型: faster模式和openai模式下的模型名字列表，英文逗号分隔
whisper.cpp模型: whisper.cpp模式下的模型名字列表，英文逗号分隔
CUDA数据类型: faster模式时cuda数据类型，int8=消耗资源少，速度快，精度低，float32=消耗资源多，速度慢，精度高，float16适合GPU加速。default默认自选
识别准确度beam_size: 字幕识别时精度调整，1-5，1=消耗显存最低，5=消耗显存最多
识别准确度best_of: 字幕识别时精度调整，1-5，1=消耗显存最低，5=消耗显存最多
启用上下文感知: 若开启将占用更多GPU，效果也更好，但也容易出现重复或幻觉
人声背景分离线程数: 人声背景声分离线程数，越大越快但占用资源越多
字幕繁体转简体: 强制将识别出的繁体字幕转为简体

【Whisper模型提示词】

whisper模型简体中文提示词: 发音语言为简体中文时发送给whisper模型的提示词
whisper模型繁体中文提示词: 发音语言为繁体中文时发送给whisper模型的提示词
whisper模型英语提示词: 发音语言为英语时发送给whisper模型的提示词
whisper模型法语提示词: 发音语言为法语时发送给whisper模型的提示词
whisper模型德语提示词: 发音语言为德语时发送给whisper模型的提示词
whisper模型日语提示词: 发音语言为日语时发送给whisper模型的提示词
whisper模型韩语提示词: 发音语言为韩语时发送给whisper模型的提示词
whisper模型俄语提示词: 发音语言为俄语时发送给whisper模型的提示词
whisper模型西班牙语提示词: 发音语言为西班牙语时发送给whisper模型的提示词
whisper模型泰国语提示词: 发音语言为泰国语时发送给whisper模型的提示词
whisper模型意大利语提示词: 发音语言为意大利语时发送给whisper模型的提示词
whisper模型葡萄牙语提示词: 发音语言为葡萄牙语时发送给whisper模型的提示词
whisper模型越南语提示词: 发音语言为越南语时发送给whisper模型的提示词
whisper模型阿拉伯语提示词: 发音语言为阿拉伯语时发送给whisper模型的提示词
whisper模型土耳其语提示词: 发音语言为土耳其语时发送给whisper模型的提示词
whisper模型印度语提示词: 发音语言为印度语时发送给whisper模型的提示词
whisper模型匈牙利语提示词: 发音语言为匈牙利语时发送给whisper模型的提示词
whisper模型乌克兰语提示词: 发音语言为乌克兰语时发送给whisper模型的提示词
whisper模型印尼语提示词: 发音语言为印尼语时发送给whisper模型的提示词
whisper模型马来语提示词: 发音语言为马来西亚语时发送给whisper模型的提示词
whisper模型哈萨克语提示词: 发音语言为哈萨克语时发送给whisper模型的提示词
whisper模型捷克语提示词: 发音语言为捷克语时发送给whisper模型的提示词
whisper模型波兰语提示词: 发音语言为波兰语时发送给whisper模型的提示词
whisper模型荷兰语提示词: 发音语言为荷兰语时发送给whisper模型的提示词
whisper模型瑞典语提示词: 发音语言为瑞典语时发送给whisper模型的提示词
whisper模型希伯来语提示词: 发音语言为瑞典语时发送给whisper模型的提示词
whisper模型孟加拉语提示词: 发音语言为瑞典语时发送给whisper模型的提示词
whisper模型波斯语提示词: 发音语言为波斯语时发送给whisper模型的提示词
whisper模型乌尔都语提示词: 发音语言为乌尔都语时发送给whisper模型的提示词
whisper模型粤语提示词: 发音语言为粤语时发送给whisper模型的提示词
whisper模型菲律宾语提示词: 发音语言为菲律宾语时发送给whisper模型的提示词

高级设置各个选项说明 ​

【通用设置】 ​

【视频输出控制】 ​

【字幕翻译调整】 ​

【字幕配音调整】 ​

【字幕声音画面对齐】 ​

【语音识别参数】 ​

【Whisper模型提示词】 ​

高级设置各个选项说明

【通用设置】

【视频输出控制】

【字幕翻译调整】

【字幕配音调整】

【字幕声音画面对齐】

【语音识别参数】

【Whisper模型提示词】