Gemini AI 转录音频视频为 SRT 字幕的工具 | pyVideoTrans官网-开源免费视频翻译配音软件 pyvideotrans.com pyvideotrans github github.com/jianchang512/pyvideotrans

准备工作: 确保您已经科学上网。
访问 Google AI Studio: 打开网址 https://aistudio.google.com/apikey 。
注册/登录: 如果您没有 Google 账号，请先注册一个。
创建 API Key: 点击“创建密钥”按钮。
复制 API Key: 复制自动生成的 API Key。

这是一个使用 Gemini AI 转录音频视频为 SRT 字幕的工具

预打包版下载地址
预打包版仅适用于 win10/11, Macos和Linux系统请使用源码部署
百度网盘地址：https://pan.baidu.com/s/10gJVMa5L3wnzlf1tFd9euw?pwd=dtpt

音视频内容已成为我们获取知识、分享观点的重要载体。高效地将音视频内容转化为文字，特别是转为有精确时间轴的字幕，通常更多的是使用 OpenAI 开源的 Whisper实现。

Gemini AI 的出现为我们带来了新的解决方案。它凭借强大的自然语言处理能力，可以快速、准确地将音视频内容转录为文字。并且Gemini AI 提供了可观的每日免费额度，足以满足日常的音视频转录需求。

但是，直接将完整的音视频文件发送给 Gemini AI 虽然可以快速获得 SRT 格式的字幕，但时间轴往往不够精确。这主要是因为 Gemini AI 在处理长音频时，可能会出现时间轴偏移。
为了解决这个问题，开发了一个简单易用的工具，它会自动完成以下步骤：
智能切片： 利用 VAD（语音活动检测）模型，将音视频文件智能切分成小片段。
逐片转录： 将每个片段单独发送给 Gemini AI 进行转录。
精准组装： 将转录结果按时间顺序重新组装成一个完整的 SRT 字幕文件，确保时间轴的准确性。

无需复杂的设置，只需简单操作，即可获得时间轴精确的 SRT 字幕！