WAAS, desarrollado por Schibsted, es una solución innovadora que integra una interfaz gráfica de usuario (GUI) y una API para la transcripción de archivos de audio y video utilizando la tecnología OpenAI Whisper. Esta herramienta está diseñada para simplificar el proceso de transcripción, permitiendo a los usuarios subir archivos multimedia y recibir transcripciones precisas en varios formatos, como texto plano, SRT y VTT.
Una de las características destacadas de WAAS es su capacidad para manejar colas de trabajo de manera asíncrona, lo que asegura que las solicitudes de transcripción se procesen de manera eficiente. Además, ofrece la opción de recibir notificaciones por correo electrónico con enlaces de descarga una vez que la transcripción esté lista, o utilizar webhooks para integraciones más avanzadas.
WAAS también incluye un editor local en el navegador que permite a los usuarios corregir errores en las transcripciones y guardar los cambios directamente en su dispositivo. Esta funcionalidad es especialmente útil para quienes necesitan realizar ajustes precisos en las transcripciones generadas.
Para los desarrolladores, WAAS proporciona una API robusta que soporta diversas operaciones, incluyendo la detección de idioma, la transcripción y la traducción de audio. La API está diseñada para ser fácil de integrar en aplicaciones existentes, con soporte para diferentes modelos de OpenAI Whisper, desde el más básico hasta el más avanzado, dependiendo de las necesidades de precisión y recursos disponibles.
La instalación y configuración de WAAS son sencillas, con opciones para ejecutar la aplicación en entornos Docker, incluyendo soporte para GPU NVIDIA para acelerar el procesamiento de transcripciones. Esto hace que WAAS sea una solución accesible tanto para usuarios finales como para desarrolladores que buscan incorporar capacidades de transcripción de audio y video en sus proyectos.