配音渠道会根据字幕文件,一行一行地进行智能配音。你还可以自由调整语速、音量和音调,让声音效果更贴合你的需求。
在这里,你可以看到所有支持的配音选项
温馨提示: 某些高级配音服务,如 OpenAI、微软 Azure、字节火山语音等,需要你提供个人的 API 地址或密钥(SK)才能使用。别担心,设置非常简单!
只需点击软件顶部的 “菜单” -> “TTS 设置”,找到相应的选项并填入你的信息即可。
在这里,配置你的专属 API 密钥
我们为你整合了多种不同类型的配音服务,从完全免费到专业级,从云端服务到本地部署,满足不同用户的需求。
点击渠道名字,查看该渠道详细使用方法。
一、 开箱即用型 (免费 & 便捷)
这类服务无需复杂配置,非常适合新手或快速制作。
- Edge-TTS (免费)
- 简介: 这是由微软提供的免费配音服务,声音自然,效果出众。
- 注意: 如果在短时间内大量使用,可能会因为微软的访问频率限制,导致配音失败或生成音频出现静音片段。
二、 专业云服务型 (需申请 API Key)
这类服务通常由大公司提供,效果稳定,音色选择丰富,但部分需要付费。
- 简介: 微软旗下的专业级语音服务,提供多种高度逼真的声音,效果非常出色。
- 要求: 需要前往微软 Azure 官网开通语音服务。
- 简介: 由开发 ChatGPT 的 OpenAI 公司提供,声音技术领先,效果非常自然。
- 要求: 需要拥有 OpenAI 账户并获取 SK 密钥。
- 简介: 由字节跳动(抖音母公司)提供,中文发音地道,音色丰富。
- 要求: 需要在火山引擎官网开通服务并创建应用。
- 简介: 阿里巴巴提供的语音合成服务,依托其强大的大模型技术。
- 要求: 需要开通阿里云上的“百炼”服务并申请 API Key。
- 简介: 谷歌提供的 TTS 服务。
- 要求: 需要能够访问谷歌服务,并申请 Gemini API Key。免费账号的请求限制非常严格,可能仅能成功配音几条字幕。
- 简介: 一家专注于 AI 音频技术的热门公司,提供丰富且高表现力的声音。
- 要求: 需要在其官网 Elevenlabs.io 申请 API Key。免费账号的限制较多,可能不足以完成一个完整的项目。
- 要求: 需要访问 302.ai 官网申请 App Key。
- 要求: 需要前往 minimaxi.com 申请 API Key,并进行充值后使用。
三、 本地部署型 (高自由度 & 适合高阶玩家)
如果你追求更高的自由度、想要克隆自己的声音,或者不希望依赖第三方云服务,那么本地部署是你的最佳选择。这通常需要一定的技术能力和较好的电脑配置。
- 简介: 一个非常热门的开源项目,只需少量音频样本即可克隆任何人的声音,效果惊艳。
- 要求: 需要在自己的电脑上部署服务。
- 简介: 另一个优秀的本地部署方案,提供高质量的语音合成。
- 要求: 需要在本地环境中进行部署。
- 简介: 专门为对话场景设计的 TTS 模型,能生成非常自然、带情感的对话语音。
- 要求: 需要在本地部署其
ChatTTS-UI
服务。
- 要求: 需要在本地环境中进行部署。
- 要求: 需要在本地部署服务,并配合
api.py
文件使用。
- 要求: 需要在本地部署服务,并配合
- 要求: 需要在本地环境中进行部署。
F5-TTS / Spark / IndexTTS / DiaTTS / VoxCPM
- 简介: 这五个渠道共用一个设置后台。
- 要求: 均需要本地部署,并在 菜单 -> TTS 设置 -> F5TTS 中配置各自的 API 地址。
四、 终极定制型
- 自定义 TTS-API
- 简介: 如果以上所有渠道都无法满足你,或者你自己开发了一套语音服务,这个选项为你提供了无限可能。
- 要求: 具备一定的编程能力,可以自行编写或部署一个符合我们数据格式要求的 API 接口。