WAAS(Whisper as a Service)는 OpenAI의 Whisper 기술을 기반으로 한 GUI 및 API 서비스로, 사용자가 오디오 또는 비디오 파일을 업로드하고 이를 텍스트로 변환할 수 있게 해줍니다. 이 서비스는 파일 업로드 후 자동으로 자막을 생성하고, 완료 시 이메일을 통해 다운로드 링크를 제공합니다. 사용자는 이메일에서 직접 Jojo 파일, SRT, 또는 텍스트 파일을 다운로드할 수 있으며, 프론트엔드에 Jojo 파일을 업로드하여 편집기로 이동할 수 있습니다.
편집기는 브라우저 내에서 100% 로컬로 작동하며, 사용자는 세그먼트를 듣고 자막 오류를 수정할 수 있습니다. 작업 완료 후, Jojo 파일을 데스크톱에 저장할 수 있습니다. 키보드의 Control 키를 누르고 있으면 선택한 세그먼트를 쉽게 재생할 수 있는 기능도 제공됩니다.
WAAS는 VG에 의해 시작된 프로젝트로, API 문서를 통해 새로운 자막 작업을 큐에 추가하고, 작업 상태를 확인하며, 완료된 작업 결과를 요청된 출력 형식으로 받을 수 있는 방법을 제공합니다. 또한, 웹훅을 사용하여 작업 성공 또는 실패 시 알림을 받을 수 있습니다.
이 프로젝트는 Python 3.8-3.10과 호환되며, Docker를 사용한 전체 설정 및 NVIDIA CUDA를 통한 GPU 가속도 지원합니다. WAAS는 오픈 소스 프로젝트로, GitHub에서 코드를 확인하고 기여할 수 있습니다.