Autosub é uma utilidade projetada para reconhecimento automático de fala e geração de legendas. Ele aceita um arquivo de vídeo ou áudio como entrada, realiza a detecção de atividade de voz para identificar regiões de fala, faz solicitações paralelas à API Google Web Speech para gerar transcrições para essas regiões, (opcionalmente) as traduz para um idioma diferente e, finalmente, salva as legendas resultantes em disco. Suporta uma variedade de idiomas de entrada e saída (para ver quais, execute a utilidade com o argumento --list-languages
) e pode atualmente produzir legendas no formato SRT ou JSON simples.
Para instalar o Autosub, primeiro instale o ffmpeg e, em seguida, execute pip install autosub
. O uso básico envolve a execução do comando autosub
seguido do caminho do arquivo de vídeo ou áudio que você deseja legendar. A ferramenta oferece várias opções, como especificar o número de solicitações de API concorrentes, o caminho de saída para as legendas, o formato de legenda desejado, o idioma de origem e o idioma de destino para as legendas, e a chave da API do Google Translate para tradução de legendas.
Autosub é uma solução eficiente para quem precisa de legendas automáticas para vídeos, facilitando a acessibilidade e a compreensão do conteúdo. Embora o projeto não esteja mais sendo mantido ativamente, ele continua sendo uma ferramenta útil para geração de legendas automáticas.