schibsted/WAAS: Whisper как Сервис
schibsted/WAAS - это офигенный сервис для транскриба аудио, который даёт графический интерфейс пользователя (GUI) и API с очередью для OpenAI Whisper. Тут можно легко загрузить аудио или видео файл для транскриба. После окончания транскрибации, придёт письмо на почту с ссылками для скачивания. Редактор работает прямо в браузере, позволяет слушать отрезки и править ошибки в транскрипции. Сервис также предлагает разные опции, типа определения языка аудиофайла и выбора модели транскриба. Ещё есть возможность использовать вебхуки, чтобы получать уведомления о статусе транскрибации.
Особенности
- GUI для загрузки и транскриба файлов: Можно без проблем загрузить аудио или видео файл и получить транскрипцию.
- Локальная работа редактора в браузере: Работает в браузере, что делает работу с данными удобной и безопасной.
- Определение языка аудиофайла: Сервис может определить язык аудиофайла для более точной транскрибации.
- Выбор модели транскриба: Можно выбрать модель транскриба в зависимости от своих потребностей.
- Вебхуки для уведомлений: Можно использовать вебхуки, чтобы быть в курсе статуса транскрибации.
Установка и запуск
- Чтобы установить, нужно создать файл.envrc с нужными настройками.
- Можно запустить сервис с помощью docker-compose, включая поддержку NVIDIA CUDA.
- Также доступна установка с помощью devcontainers.
Тестирование
Тестирование сервиса делается с помощью команды pytest.
Часто задаваемые вопросы
В статье также рассматриваются частые вопросы, например, как решить проблему с сертификатом [SSL: CERTIFICATE_VERIFY_FAILED].