你可能还不知道，Gemini2.5 新增多说话人文字配音(TTS)，可免费使用

你可能还不知道，Google 的 Gemini 2.5 新增了一项非常实用的功能——多说话人文字配音！可在 Google AI Studio 上免费使用。该功能由gemini-2.5-flash-preview-tts和gemini-2.5-pro-preview-tts模型实现。

重要提示：
科学上网能力：访问 Google AI 服务，你需要能够访问国际互联网（请自行解决网络问题）。这是使用国外 AI 工具的基础，否则后续步骤无法进行。
Google 账号：你需要一个免费的 Google 账号。如果还没有，可以前往 Google 官网注册，通常国内手机号即可完成注册。

一、打开 Gemini 配音网页

你可以通过以下任一方式进入 Gemini 的文字转语音功能页面：

直接访问：在浏览器中打开链接 https://aistudio.google.com/generate-speech
通过 AI Studio 主页进入：如果你已经登录 Google AI Studio，也可以按照下图指引找到语音生成功能入口。

如果页面无法打开，或者打开后看到类似下图提示“当前地区不支持”（例如，使用香港地区的网络节点时常会遇到此问题），请尝试切换你的网络代理节点到其他国家或地区（如美国、新加坡等）。

若看到此页面，说明当前网络节点所在区域不受支持，请尝试切换

成功打开后，你会看到如下的语音生成界面：

这才是 Gemini 免费文字转语音的正确界面

二、界面概览与模式切换

别担心，虽然是英文界面，但操作起来非常简单。下面我们会一步步说明。

Gemini 的语音生成工具会自动检测你输入的文本语言，目前支持多达 24 种语言(虽文档中未列明支持中文，但实际是支持的)。

默认情况下，你将进入 多说话人 (Multi-speaker audio) 配音界面：

默认进入的是多说话人配音界面

如果你只需要单个声音进行配音，可以点击界面右侧的 Singe-speaker audio 切换到 单说话人 (Single-speaker audio) 模式。单人模式的界面更为简洁：

点击右侧可切换为单说话人配音模式

三、多说话人配音实操步骤

我们重点介绍功能更丰富的多说话人配音，目前仅 支持2个说话人。

1. 准备并粘贴配音文本

在界面左侧的 Raw structure 文本框中，输入或粘贴你想要配音的文字内容。 关键点：

分行：建议每行内容不要过长，以自然的语句停顿为佳。
指定说话人：在每一行的开头，使用 说话人X: (英文冒号) 的格式来指定由哪个角色朗读该行。例如： 说话人1: 今天是个好日子，风和日丽。说话人2: 是啊，我们去公园散步怎么样？
Gemini 会为标记了不同说话人的行分配不同的声音。目前最多支持两位说话人（例如，你可以定义 "说话人1" 和 "说话人2"）。

2. 配置说话人角色 (Voice settings)

在界面右侧的 Voice settings 区域，你需要为每个说话人进行配置：

设置说话人名称 (Name)：如下图所示，在 Name 输入框中填写的名称，必须与你在左侧文本中每行开头的说话人标识（如 "说话人1"、"说话人2"）完全一致。大小写、数字、甚至空格都要匹配。
选择发音人 (Voice)：在 Name下方的 Voice 下拉菜单中，你可以为当前选定的说话人选择一个具体的发音人角色。点击每个角色旁边的播放按钮可以试听其音色，选择你最喜欢的声音。