号称球表最强人工智能语音公司 ElevenLabs最近推出了一款语音识别模型 scribe_v1,支持99种语言的音频转录为文字。
而且免费额度还挺高,单次支持上传 1G的音频或视频文件。
在视频翻译软件 pyVideoTrans中使用 本文介绍两种使用方式,在线web使用
在视频翻译软件中使用
升级到 v0.59版本 https://pvt9.com/downpackage
进入该页面创建一个 api key: https://elevenlabs.io/app/settings/api-keys
在视频翻译软件 菜单--TTS设置--Elevenlabs.io中填写你复制的api key,然后保存
在语音识别渠道中选择 Elevenlabs.io就可以使用了。
在网页中使用
- 进入该网页 **https://elevenlabs.io/app/speech-to-text**,如果没有账号请邮箱注册,无需手机验证无需绑卡无需充值。
- 登录后左侧点击Speech to text,如下图操作
- 等待转录完成后,点击显示的名字进入转录结果页