autosub는 비디오 또는 오디오 파일을 입력으로 받아 음성 활동 감지를 통해 음성 영역을 찾고, Google Web Speech API에 병렬 요청을 만들어 해당 영역에 대한 전사를 생성하며, (선택적으로) 이를 다른 언어로 번역하고, 최종적으로 결과 자막을 디스크에 저장하는 유틸리티입니다. 이 도구는 다양한 입력 및 출력 언어를 지원하며(어떤 언어를 지원하는지 보려면 --list-languages
인수를 사용하여 유틸리티를 실행하세요), 현재 SRT 형식 또는 간단한 JSON 형식으로 자막을 생성할 수 있습니다.
설치 방법은 ffmpeg를 설치한 후 pip install autosub
를 실행하면 됩니다. 사용법은 autosub -h
를 통해 확인할 수 있으며, 이 명령어는 도구의 사용법과 가능한 옵션들을 보여줍니다. 주요 옵션으로는 동시 API 요청 수, 출력 경로, 자막 형식, 소스 파일의 언어, 자막을 원하는 언어, Google Translate API 키 등이 있습니다.
이 프로젝트는 더 이상 유지보수되지 않으며, MIT 라이선스 하에 배포됩니다. autosub는 비디오 파일에 대한 자동 자막 생성을 원하는 사용자에게 유용한 도구입니다.