Skip to content

配音渠道会根据字幕文件,一行一行地进行智能配音。你还可以自由调整语速、音量和音调,让声音效果更贴合你的需求。

配音渠道选择界面在这里,你可以看到所有支持的配音选项

温馨提示: 某些高级配音服务,如 OpenAI、微软 Azure、字节火山语音等,需要你提供个人的 API 地址或密钥(SK)才能使用。别担心,设置非常简单!

只需点击软件顶部的 “菜单” -> “TTS 设置”,找到相应的选项并填入你的信息即可。

TTS 设置菜单在这里,配置你的专属 API 密钥

我们为你整合了多种不同类型的配音服务,从完全免费到专业级,从云端服务到本地部署,满足不同用户的需求。

点击渠道名字,查看该渠道详细使用方法。

一、 开箱即用型 (免费 & 便捷)

这类服务无需复杂配置,非常适合新手或快速制作。

  • Edge-TTS (免费)
    • 简介: 这是由微软提供的免费配音服务,声音自然,效果出众。
    • 注意: 如果在短时间内大量使用,可能会因为微软的访问频率限制,导致配音失败或生成音频出现静音片段。

二、 专业云服务型 (需申请 API Key)

这类服务通常由大公司提供,效果稳定,音色选择丰富,但部分需要付费。

  • 微软 Azure TTS

    • 简介: 微软旗下的专业级语音服务,提供多种高度逼真的声音,效果非常出色。
    • 要求: 需要前往微软 Azure 官网开通语音服务。
  • OpenAI-TTS

    • 简介: 由开发 ChatGPT 的 OpenAI 公司提供,声音技术领先,效果非常自然。
    • 要求: 需要拥有 OpenAI 账户并获取 SK 密钥。
  • 字节火山语音合成

    • 简介: 由字节跳动(抖音母公司)提供,中文发音地道,音色丰富。
    • 要求: 需要在火山引擎官网开通服务并创建应用。
  • 阿里 Qwen-TTS

    • 简介: 阿里巴巴提供的语音合成服务,依托其强大的大模型技术。
    • 要求: 需要开通阿里云上的“百炼”服务并申请 API Key。
  • Gemini-TTS

    • 简介: 谷歌提供的 TTS 服务。
    • 要求: 需要能够访问谷歌服务,并申请 Gemini API Key。免费账号的请求限制非常严格,可能仅能成功配音几条字幕。
  • Elevenlabs.io TTS

    • 简介: 一家专注于 AI 音频技术的热门公司,提供丰富且高表现力的声音。
    • 要求: 需要在其官网 Elevenlabs.io 申请 API Key。免费账号的限制较多,可能不足以完成一个完整的项目。
  • 302.AI 配音

    • 要求: 需要访问 302.ai 官网申请 App Key。
  • Minimaxi 配音

    • 要求: 需要前往 minimaxi.com 申请 API Key,并进行充值后使用。

三、 本地部署型 (高自由度 & 适合高阶玩家)

如果你追求更高的自由度、想要克隆自己的声音,或者不希望依赖第三方云服务,那么本地部署是你的最佳选择。这通常需要一定的技术能力和较好的电脑配置。

  • GPT-SoVITS

    • 简介: 一个非常热门的开源项目,只需少量音频样本即可克隆任何人的声音,效果惊艳。
    • 要求: 需要在自己的电脑上部署服务。
  • CosyVoice

    • 简介: 另一个优秀的本地部署方案,提供高质量的语音合成。
    • 要求: 需要在本地环境中进行部署。
  • ChatTTS

    • 简介: 专门为对话场景设计的 TTS 模型,能生成非常自然、带情感的对话语音。
    • 要求: 需要在本地部署其 ChatTTS-UI 服务。
  • Fish-TTS

    • 要求: 需要在本地环境中进行部署。
  • ChatterBox-TTS

    • 要求: 需要在本地部署服务,并配合 api.py 文件使用。
  • Kokoro-TTS

    • 要求: 需要在本地环境中进行部署。
  • F5-TTS / Spark / IndexTTS / DiaTTS / VoxCPM

    • 简介: 这五个渠道共用一个设置后台。
    • 要求: 均需要本地部署,并在 菜单 -> TTS 设置 -> F5TTS 中配置各自的 API 地址。

四、 终极定制型

  • 自定义 TTS-API
    • 简介: 如果以上所有渠道都无法满足你,或者你自己开发了一套语音服务,这个选项为你提供了无限可能。
    • 要求: 具备一定的编程能力,可以自行编写或部署一个符合我们数据格式要求的 API 接口。