Unreal Speechは、テキストを音声に変換するための革新的なAPIです。このサービスは、Eleven LabsやPlay.htと比較して最大10倍、Amazon、Microsoft、Googleと比較して最大2倍のコスト削減を実現します。Unreal Speechは、大量のテキストを高速で音声に変換する能力を持ち、リアルタイムアプリケーションや長編オーディオの生成に最適です。
APIは、短いテキストのための/stream
エンドポイントと、長いテキストのための/synthesisTasks
エンドポイントを提供します。/stream
エンドポイントは、最大1,000文字のテキストを即座に音声に変換し、/synthesisTasks
エンドポイントは、10時間のオーディオを15分で生成することができます。
Unreal Speechは、エンタープライズプランを含む複数のプランを提供しており、625M文字/月の利用が可能です。追加利用分は、1M文字あたり$8で利用可能です。このAPIは、商用利用が可能で、生成されたオーディオはポッドキャスト、ビデオ、その他のメディアで使用することができます。
Unreal Speechは、現在英語の音声のみをサポートしていますが、多言語音声サポートの開発を進めており、3〜6ヶ月以内に提供を開始する予定です。また、カスタム音声(音声クローニング)の機能も開発中です。
Unreal Speechを使用することで、テキストを音声に変換するコストを大幅に削減し、高品質なリスニング体験を提供することができます。