schibsted/WAAS:Whisper 作为服务(为 OpenAI Whisper 提供的带有排队功能的图形用户界面和 API)
schibsted/WAAS 是一个强大的工具,为用户提供了音频或视频文件的上传和转录功能。它具有以下特点:
- 便捷的上传与转录:用户可以轻松上传音频或视频文件,并进行转录操作。
- 多种输出格式:提供多种输出格式,如 JSON、timecode_txt、txt、vtt 和 srt 等,满足不同用户的需求。
- 语言检测功能:能够检测音频文件的语言。
- Webhook 响应:支持通过 Webhook 接收转录结果的通知。
该工具的编辑器在用户的浏览器中本地运行,用户可以在其中收听片段并修复转录错误。完成后,用户可以将文件保存到桌面。此外,通过按住键盘上的 Control 键,用户可以轻松播放选定的片段。
在安装和运行方面,schibsted/WAAS 有一定的要求。例如,所需的 VRAM 量取决于所使用的模型,代码库应与 Python 3.8 - 3.10 兼容。用户可以通过多种方式进行安装和运行,如使用 docker-compose 或 devcontainers 等。
总的来说,schibsted/WAAS 为用户提供了一种高效、便捷的音频或视频文件转录解决方案。