WhisperUI 소개
WhisperUI는 OpenAI Whisper 기술을 활용한 강력한 음성-텍스트 및 텍스트-음성 변환 도구입니다. 이는 데스크톱 버전으로 제공되며, 회원가입이나 로그인을 통해 사용할 수 있습니다.
주요 기능
음성-텍스트 변환
- 다양한 형식의 음성 파일을 지원합니다. MP3, MP4, MPEG, MPGA, M4A, WAV, OGG, WEBM 등의 파일 형식을 Drag and Drop 하거나 파일을 찾아 선택할 수 있습니다. 단, 파일 업로드 크기는 25MB로 제한되어 있습니다.
- OpenAI Whisper는 인터넷에서 수집한 680,000시간의 다국어 및 다중작업 감독 데이터로 훈련되었습니다. 이로 인해 다양한 발음, 배경 소음, 기술 용어 등에 강한 성능을 보입니다. 또한 여러 언어의 음성을 영어로 번역할 수도 있습니다.
텍스트-음성 변환
- 음성 파일을 텍스트로 변환한 후, 필요에 따라 이를 SRT 파일로도 변환할 수 있습니다. 이는 자막 생성 등에 유용합니다.
사용 방법
- 먼저 OpenAI API Key를 발급받아야 합니다. 이는 직접 발급받을 수 있습니다.
- 음성 파일을 웹 앱에 업로드합니다. 이때 파일 크기가 25MB를 초과하면 먼저 파일을 압축해야 합니다.
- 업로드된 음성 파일은 OpenAI Whisper를 통해 텍스트로 변환되고, 결과 텍스트는 사용자에게 표시되어 수정 및 교정할 수 있습니다.
유료 기능
- 여러 파일을 한 번에 업로드할 수 있습니다.
- 일일 파일 업로드 제한이 없습니다.
- 음성 파일을 SRT 파일로 변환할 수 있습니다.
정확도와 시간
OpenAI Whisper는 높은 정확도로 유명하지만, 최종 전사 결과는 음성 파일의 품질과 발화의 명확도에 따라 달라집니다. 또한 음성 파일을 전사하는데 걸리는 시간은 파일의 길이와 발화의 복잡도에 따라 다르며, 대부분의 파일은 몇 분 내에 전사됩니다.
지원 언어
OpenAI Whisper는 영어, 스페인어, 프랑스어, 독일어, 중국어 등 여러 언어를 지원합니다.
WhisperUI는 다양한 기능과 편리함을 제공하여 음성-텍스트 및 텍스트-음성 변환에 유용한 도구입니다.