schibsted/WAAS: Whisper as a Service (GUI 및 API)
schibsted/WAAS는 OpenAI Whisper를 기반으로 하는 강력한 서비스로, 오디오 또는 비디오 파일의 업로드와 전사를 위한 GUI 및 API를 제공합니다. 이 서비스는 사용자가 파일을 업로드한 후 전사가 완료되면 다운로드 링크가 포함된 이메일을 받을 수 있도록 합니다.
주요 특징:
- 편리한 업로드 및 전사: 사용자는 오디오 또는 비디오 파일을 쉽게 업로드하고 전사 작업을 요청할 수 있습니다.
- 다양한 출력 옵션: 사용자는 JSON, SRT, 텍스트 등 다양한 출력 형식을 선택할 수 있습니다.
- 로컬 편집: 편집기는 브라우저에서 100% 로컬로 작동하며, 사용자는 세그먼트를 들으며 전사 오류를 수정할 수 있습니다.
- 웹훅 지원: 웹훅을 사용하여 전사 상태를 실시간으로 모니터링할 수 있습니다.
설치 및 실행 방법:
- Python 가상환경 설정:
python3 -mvenv.venv
,source.venv/bin/activate
,pip install -r requirements.txt
를 실행하여 필요한 패키지를 설치합니다. - Docker-compose 사용:
.envrc
파일을 생성하고 필요한 환경 변수를 설정한 후,docker-compose --env-file.envrc up
명령어로 Docker 컨테이너를 실행합니다. - NVIDIA CUDA 사용:
docker-compose.yml
파일을 수정하여 NVIDIA GPU를 사용할 수 있습니다.
테스트 방법:
pytest
명령어를 사용하여 테스트를 실행할 수 있습니다.
schibsted/WAAS는 오디오 및 비디오 파일의 전사를 간편하고 효율적으로 처리할 수 있는 유용한 도구입니다.