GitHub - schibsted/WAAS: OpenAI Whisper를 위한 GUI 및 API 서비스

WAAS

WAAS는 OpenAI Whisper 기술을 활용한 GUI 및 API 서비스로, 오디오/비디오 파일의 자막 생성 및 편집을 지원합니다. Docker 및 NVIDIA CUDA를 통한 GPU 가속도 제공.

GitHub - schibsted/WAAS: OpenAI Whisper를 위한 GUI 및 API 서비스

WAAS(Whisper as a Service)는 OpenAI의 Whisper 기술을 기반으로 한 GUI 및 API 서비스로, 사용자가 오디오 또는 비디오 파일을 업로드하고 이를 텍스트로 변환할 수 있게 해줍니다. 이 서비스는 파일 업로드 후 자동으로 자막을 생성하고, 완료 시 이메일을 통해 다운로드 링크를 제공합니다. 사용자는 이메일에서 직접 Jojo 파일, SRT, 또는 텍스트 파일을 다운로드할 수 있으며, 프론트엔드에 Jojo 파일을 업로드하여 편집기로 이동할 수 있습니다.

편집기는 브라우저 내에서 100% 로컬로 작동하며, 사용자는 세그먼트를 듣고 자막 오류를 수정할 수 있습니다. 작업 완료 후, Jojo 파일을 데스크톱에 저장할 수 있습니다. 키보드의 Control 키를 누르고 있으면 선택한 세그먼트를 쉽게 재생할 수 있는 기능도 제공됩니다.

WAAS는 VG에 의해 시작된 프로젝트로, API 문서를 통해 새로운 자막 작업을 큐에 추가하고, 작업 상태를 확인하며, 완료된 작업 결과를 요청된 출력 형식으로 받을 수 있는 방법을 제공합니다. 또한, 웹훅을 사용하여 작업 성공 또는 실패 시 알림을 받을 수 있습니다.

이 프로젝트는 Python 3.8-3.10과 호환되며, Docker를 사용한 전체 설정 및 NVIDIA CUDA를 통한 GPU 가속도 지원합니다. WAAS는 오픈 소스 프로젝트로, GitHub에서 코드를 확인하고 기여할 수 있습니다.

WAAS의 대체 도구

CreatorMagic

CreatorMagic

CreatorMagic은 YouTube 동영상을 텍스트로 변환하고 시청자 감정을 분석하여 콘텐츠 제작을 간소화하는 AI 기반 도구입니다.

Riverside

Riverside

Riverside는 AI를 활용하여 99% 정확도로 오디오 및 비디오를 텍스트로 변환합니다.

VideoToPage

VideoToPage

VideoToPage는 AI 기술을 활용하여 비디오나 오디오를 블로그 포스트로 즉시 요약 및 재구성하는 도구입니다.

Cynapto

Cynapto

Cynapto는 GenAI 기술을 활용한 비디오 현지화 플랫폼으로, 130개 이상의 언어로 비디오를 번역하고 더빙할 수 있습니다.

SupaClip Pro

SupaClip Pro

SupaClip Pro은 AI를 활용하여 비디오를 지식 기반으로 변환하고, 요약, 대본, 타임스탬프 및 AI 어시스턴트 기능을 제공합니다.

Braiv Player

Braiv Player

Braiv Player는 글로벌 관객을 위한 비디오 호스팅, 자막, 번역 및 AI 더빙을 제공하는 플랫폼입니다.

recaply.ai

recaply.ai

recaply.ai는 AI를 활용하여 비디오의 챕터, 결론 및 요약을 자동으로 생성해주는 도구입니다.

YouTube Transcript

YouTube Transcript

YouTube Transcript는 AI를 사용하여 초 단위로 비디오 트랜스크립트를 생성하는 도구로, 콘텐츠 제작자, 학생, 연구자 및 전문가를 위해 설계되었습니다.

VideoToTextAI

VideoToTextAI

VideoToTextAI는 AI 기반 비디오 트랜스크립션, 번역 및 캡션 추가 도구로, 소셜 미디어에서의 영향력을 극대화합니다.

TikTok Transcription Tool

TikTok Transcription Tool

TikTok Transcription Tool은 여러 TikTok 동영상을 쉽게 전사하고 분석하여 콘텐츠 전략을 강화할 수 있는 AI 도구입니다.

Vidscriber

Vidscriber

Vidscriber는 YouTube, Twitter Spaces 또는 사용자 정의 미디어 업로드에서 번개처럼 빠른 전사를 통해 시간을 초고속으로 활용할 수 있는 AI 채팅 도구입니다.

ClipWrite

ClipWrite

ClipWrite는 YouTube, TikTok 또는 팟캐스트 콘텐츠를 블로그 게시물, 소셜 미디어 스레드 또는 기사로 쉽게 변환하여 시간을 절약하고 생산성을 높이는 AI 기반 도구입니다.

CloudNein

CloudNein

CloudNein은 YouTube 동영상 자막에서 단어 빈도, 문맥 및 감정을 분석하여 인터랙티브 워드 클라우드를 생성하는 AI 도구입니다.

AudioScribe.io

AudioScribe.io

AudioScribe.io는 회의, 인터뷰, 중요한 대화에서 단 한 마디도 놓치지 않도록 도와주는 차세대 AI 기반 음성 텍스트 변환 서비스입니다.

AccurateScribe.ai

AccurateScribe.ai

AccurateScribe.ai는 100개 이상의 언어로 오디오 및 비디오를 정확한 텍스트로 변환하는 AI 기반 트랜스크립션 도구입니다.

VideoToWords.ai

VideoToWords.ai

VideoToWords.ai는 AI 기술을 활용하여 비디오와 오디오를 텍스트로 빠르고 정확하게 변환해주는 도구입니다.

Loom

Loom

Loom은 AI 기술을 활용한 화면 녹화 도구로, 팀원 및 고객과의 생산성을 극대화하는 비디오 메시지를 쉽게 기록하고 공유할 수 있습니다.

Minimemo

Minimemo

Minimemo는 인스타그램 등 플랫폼의 정보성 콘텐츠를 정리하고, 비디오 요약, 태그, 제목을 생성해주는 AI 도구입니다.

BlogMyVideo

BlogMyVideo

BlogMyVideo는 AI 기술을 활용하여 동영상, 오디오, 팟캐스트를 매력적인 블로그 포스트로 변환해주는 플랫폼입니다.

Wilowrid

Wilowrid는 AI 기반 블로그 포스트 생성 플랫폼으로, YouTube 동영상을 3번의 클릭만으로 블로그 포스트로 변환합니다.

Summify

Summify

Summify는 AI를 활용한 비디오/오디오 트랜스크라이버 및 요약 도구로, 사용자가 시간을 절약하고 콘텐츠를 쉽게 이해할 수 있도록 돕습니다.

추천 AI 도구

VideoToTextAI

VideoToTextAI

VideoToTextAI는 AI 기반 비디오 트랜스크립션, 번역 및 캡션 추가 도구로, 소셜 미디어에서의 영향력을 극대화합니다.

자세히 보기
Vidscriber

Vidscriber

Vidscriber는 YouTube, Twitter Spaces 또는 사용자 정의 미디어 업로드에서 번개처럼 빠른 전사를 통해 시간을 초고속으로 활용할 수 있는 AI 채팅 도구입니다.

자세히 보기
WordPress Transcribe AI

WordPress Transcribe AI

WordPress Transcribe AI는 최첨단 AI 기술을 활용하여 오디오 및 비디오를 정확하고 빠르게 텍스트로 변환해주는 플러그인입니다.

자세히 보기
TubeMemo

TubeMemo

TubeMemo는 YouTube 동영상에서 쉽게 메모를 캡처하고, 대본을 정리하며, 요약을 생성할 수 있는 AI 도구입니다.

자세히 보기
Insight Video IA

Insight Video IA

Insight Video IA는 AI 기술을 활용하여 강의 비디오를 교육 자료로 변환하는 도구입니다.

자세히 보기
Akkadu

Akkadu

Akkadu는 90+ 언어로 AI 지원 실시간 자막을 제공하여 회의 이해를 돕습니다.

자세히 보기
UniScribe

UniScribe

UniScribe는 AI로.mp4를 텍스트로 바꾸며 다양한 기능을 제공하는 도구입니다.

자세히 보기
Transkriptor

Transkriptor

Transkriptor는 회의, 인터뷰, 강의 등을 자동으로 텍스트로 변환해주는 AI 기반의 음성 텍스트 변환 도구입니다.

자세히 보기