Unreal Speech

Unreal Speechは、テキストを音声に変換するための革新的なAPIです。このサービスは、Eleven LabsやPlay.htと比較して最大10倍、Amazon、Microsoft、Googleと比較して最大2倍のコスト削減を実現します。Unreal Speechは、大量のテキストを高速で音声に変換する能力を持ち、リアルタイムアプリケーションや長編オーディオの生成に最適です。

APIは、短いテキストのための/streamエンドポイントと、長いテキストのための/synthesisTasksエンドポイントを提供します。/streamエンドポイントは、最大1,000文字のテキストを即座に音声に変換し、/synthesisTasksエンドポイントは、10時間のオーディオを15分で生成することができます。

Unreal Speechは、エンタープライズプランを含む複数のプランを提供しており、625M文字/月の利用が可能です。追加利用分は、1M文字あたり$8で利用可能です。このAPIは、商用利用が可能で、生成されたオーディオはポッドキャスト、ビデオ、その他のメディアで使用することができます。

Unreal Speechは、現在英語の音声のみをサポートしていますが、多言語音声サポートの開発を進めており、3〜6ヶ月以内に提供を開始する予定です。また、カスタム音声（音声クローニング）の機能も開発中です。

Unreal Speechを使用することで、テキストを音声に変換するコストを大幅に削減し、高品質なリスニング体験を提供することができます。

注目のAIツール