MusicGen AIは、Metaによって開発された革新的なAI音楽生成ツールです。このツールは、単一の言語モデル(LM)を使用して、テキスト説明やメロディーに基づいて高品質の音楽を生成することができます。MusicGenは、音楽を圧縮されたトークンにエンコードし、それを使用して音楽サンプルを生成するという方法で動作します。これにより、モノラルやステレオなど、さまざまな形式で音楽を生成することが可能です。
MusicGenの特徴には、他のオーディオトラックやユーザー作成のメロディーに基づく生成を可能にする「メロディー条件付け」、ジャンルやテンポなどのパラメータを指定したテキスト説明に影響を受けた音楽を生成する「テキスト条件付け生成」、既存のオーディオクリップを新しい音楽作成の基礎として使用する「オーディオプロンプト生成」などがあります。
さらに、MusicGenは、テキストエンコーダー、言語モデルベースのデコーダー、オーディオエンコーダー/デコーダーを含む高度なモデルアーキテクチャを採用しており、貪欲法とサンプリングの両方の生成モードを提供します。サンプリングは、より良い結果を得るために推奨されています。また、特定のプロンプトや入力なしで音楽を生成する「無条件生成」も可能です。
MusicGenは、20,000時間に及ぶ多様なライセンス音楽、高品質なトラックやインストゥルメンタルを含む広範なトレーニングデータセットで訓練されています。ユーザーは、ガイダンススケールや最大長などの生成パラメータを変更することができ、生成プロセスをカスタマイズすることができます。
MusicGen AIは、Hugging Faceプラットフォーム上で利用可能で、ユーザーフレンドリーなWebUIを提供しています。これにより、ユーザーは簡単に音楽を生成し、ダウンロードまたは保存することができます。MusicGenは、音楽作曲の革命をリードし、これまでにない方法で音楽を作成、実験、発見することを可能にします。