Skip to content

号称球表最强人工智能语音公司 ElevenLabs最近推出了一款语音识别模型 scribe_v1,支持99种语言的音频转录为文字。

而且免费额度还挺高,单次支持上传 1G的音频或视频文件。

在视频翻译软件 pyVideoTrans中使用 本文介绍两种使用方式,在线web使用

在视频翻译软件中使用

  1. 升级到 v0.59版本 https://pvt9.com/downpackage

  2. 进入该页面创建一个 api key: https://elevenlabs.io/app/settings/api-keys

  3. 在视频翻译软件 菜单--TTS设置--Elevenlabs.io中填写你复制的api key,然后保存

  4. 在语音识别渠道中选择 Elevenlabs.io就可以使用了。

在网页中使用

  1. 进入该网页 **https://elevenlabs.io/app/speech-to-text**,如果没有账号请邮箱注册,无需手机验证无需绑卡无需充值。
  2. 登录后左侧点击Speech to text,如下图操作

  1. 等待转录完成后,点击显示的名字进入转录结果页