WAAS(Whisper as a Service)は、OpenAIのWhisper技術を基盤とした革新的なサービスで、音声や動画ファイルの文字起こしを容易にします。このサービスは、ユーザーフレンドリーなGUIと強力なAPIを提供し、非同期処理による効率的な文字起こしプロセスを実現します。
WAASの主な特徴は、アップロードされた音声・動画ファイルを自動的に文字起こしし、完了後にはダウンロードリンクを含むメールを送信することです。ユーザーは、Jojoファイル、SRT、またはテキストファイルを直接ダウンロードすることができ、さらにフロントエンドにJojoファイルをアップロードしてエディタで編集することも可能です。エディタはブラウザ内で100%ローカルに動作し、セグメントを聴きながら文字起こしの誤りを修正することができます。
APIを通じて、新しい文字起こしジョブをキューに追加し、ジョブのステータスを確認することもできます。WAASは、言語の自動検出や翻訳機能もサポートしており、多様なニーズに対応します。
このプロジェクトは、VGによって開始され、コミュニティの貢献によって成長しています。WAASは、Python 3.8-3.10と互換性があり、NVIDIA CUDAを利用したGPUアクセラレーションもサポートしています。
WAASは、音声・動画コンテンツの文字起こしを必要とするあらゆるユーザーにとって、強力なツールとなるでしょう。