음성-텍스트 API | 음성 인식 | 음성 AI

Voicegain은 개발자 중심의 플랫폼으로, 정확성, 가격 및 유연성의 뛰어난 조합을 제공하는 딥러닝 ASR(자동 음성 인식) 기술을 기반으로 합니다. 이 플랫폼은 온프레미스, VPC 또는 클라우드 서비스로 배포될 수 있으며, 주요 콜센터, 비디오 회의 및 봇 플랫폼과의 통합을 지원합니다. Voicegain의 ASR은 최신 딥러닝 기술을 활용하여 구축되었으며, 수만 시간의 다양한 오디오 데이터셋으로 훈련되었습니다. 이를 통해 사용자는 자신의 데이터로 모델을 훈련시켜 높은 정확도를 달성할 수 있습니다. 또한, Voicegain은 주요 클라우드 음성-텍스트 제공업체 대비 50%-75% 저렴한 가격으로 제공되며, 에지/온프레미스 배포를 위한 매우 경제적인 가격 정책을 가지고 있습니다. Voicegain은 다중 테넌트 클라우드에서 접근할 수 있거나, 사용자의 데이터센터 또는 VPC에 배포할 수 있어, 기존의 오디오 인프라와 프로토콜을 활용할 수 있습니다. 이 플랫폼은 Kubernetes 클러스터에 쉽게 배포될 수 있으며, CPaaS 또는 CCaaS 플랫폼과의 통합을 지원합니다. Voicegain은 영어, 스페인어, 독일어, 포르투갈어, 힌디어 및 한국어를 포함한 여러 언어를 지원하며, 최신 GPU에서의 훈련 및 추론을 위해 NVIDIA A100 및 T4를 사용합니다. Voicegain은 또한 MRCP ASR 통합을 제공하여, 음성 문법 또는 대형 어휘 전사를 사용하여 플랫폼에 접근할 수 있습니다. 이를 통해 사용자는 자신의 데이터센터 또는 VPC에 Voicegain을 배포할 수 있습니다. Voicegain은 회의, 콜센터 통화, 비디오 등의 녹음 및 전사를 통해 LLM 기반 요약, 감정 분석 등을 제공하며, 사용자의 콜센터 플랫폼과 통합할 수 있는 대화형 음성 어시스턴트를 구축할 수 있도록 지원합니다. Voicegain은 개발자들에게 음성 봇을 구축하고, 텔레포니를 통해 접근 가능한 음성 봇을 개발할 수 있는 API를 제공합니다. 또한, 음성 분석 API를 통해 오디오를 전사하고, 전사된 텍스트를 감정, NER, 키워드 및 의도 분석을 위해 분석할 수 있습니다. Voicegain은 배치 및 스트리밍 사용 사례를 모두 지원하며, MRCP ASR을 통해 MRCP 기반 플랫폼과의 통합을 제공합니다. Voicegain은 엔터프라이즈 및 Voice SaaS 회사를 위한 선도적인 에지 음성 AI 플랫폼으로, System and Organizational Control (SOC) 2 Type 1 감사를 성공적으로 완료했습니다. 이 플랫폼은 Zoom, Microsoft Teams, Google Meet와 같은 비디오 회의 플랫폼과의 통합을 지원하며, 에지(온프레미스 또는 VPC) 옵션을 제공합니다. Voicegain은 사용자에게 웹 회의 브라우저 탭에서 오디오를 공유하거나, 사전 녹음된 오디오 파일을 업로드하여 전사를 검토할 수 있는 기능을 제공합니다. 또한, Windows 데스크톱 앱을 통해 Zoom 로컬 녹음을 자동으로 제출할 수 있습니다. Voicegain은 NLU를 사용하여 회의의 주제, 긍정적 및 부정적 하이라이트를 추출하고, 전사본에 이를 강조 표시할 수 있습니다. Voicegain은 개발자들이 정확하고, 경제적이며, 접근 가능한 음성-텍스트 플랫폼을 통해 훌륭한 음성 활성화 앱을 구축할 수 있도록 지원합니다.