Autosub 是一款实用的自动语音识别和字幕生成工具。它能够接收视频或音频文件作为输入,通过语音活动检测找到语音区域,并行请求 Google Web Speech API 生成这些区域的转录,并可选地将它们翻译成另一种语言,最后将生成的字幕保存到磁盘。Autosub 支持多种输入和输出语言(要查看支持的语言,可以运行带有 --list-languages
参数的实用程序),并且目前能够生成 SRT 格式或简单 JSON 格式的字幕。
安装 Autosub 需要先安装 ffmpeg,然后通过运行 pip install autosub
来安装 Autosub。使用 Autosub 时,可以通过命令行参数指定并发请求的数量、输出路径、字幕格式、源语言、目标语言以及 Google Translate API 密钥等。
Autosub 的使用非常简单,只需在命令行中输入 autosub -h
即可查看所有可用的命令和参数。例如,要为一个视频文件生成字幕,可以使用以下命令:autosub -S en -D zh -K YOUR_API_KEY video.mp4
,这将生成英文到中文翻译的字幕。
需要注意的是,Autosub 目前已经不再维护,但作为一个开源项目,它仍然是一个非常有用的工具,特别是对于那些需要快速生成字幕的用户。