Gen-2: 新しい動画生成のスタンダード
Gen-2は、テキスト、画像、または動画クリップを使用して新しい動画を生成するマルチモーダルAIシステムです。これにより、実際に撮影することなく、まるで新しいものを撮影しているかのように、リアルで一貫性のある新しい動画を合成できます。
機能の概要
Gen-2は、以下のような多様なモードを提供しています。
モード01: テキストから動画へ
テキストプロンプトだけを使って、想像できるあらゆるスタイルの動画を合成します。たとえば、「ニューヨークのロフトの窓から差し込む夕方の太陽」といったプロンプトを入力することで、その情景を視覚化できます。
モード02: テキスト + 画像から動画へ
ドライビングイメージとテキストプロンプトを使用して動画を生成します。たとえば、「ネオンの看板に照らされた通りを歩く男性の低角度ショット」といったプロンプトを入力できます。
モード03: 画像から動画へ
ドライビングイメージだけを使用して動画を生成します。これにより、特定の画像のバリエーションを持つ動画を作成できます。
モード04: スタイライズ
任意の画像やプロンプトのスタイルを動画の各フレームに適用します。
モード05: ストーリーボード
モックアップを完全にスタイライズされたアニメーションレンダリングに変換します。
モード06: マスク
モックアップを完全にスタイライズされたアニメーションレンダリングに変換します。
モード07: レンダリング
テクスチャのないレンダリングを、入力画像やプロンプトを適用することでリアルな出力に変換します。
モード08: カスタマイズ
Gen-1のフルパワーを引き出し、さらに高い忠実度の結果を得るためにモデルをカスタマイズします。
新しい動画生成の基準
ユーザー調査に基づくと、GEN-1の結果は、画像から画像、動画から動画への変換において既存の方法よりも好まれています。具体的には、73.53%がStable Diffusion 1.5よりも好まれ、88.24%がText2Liveよりも好まれました。
映画制作の未来を探る
Runway Researchは、新しい創造性の形を可能にするマルチモーダルAIシステムの構築に専念しています。Gen-1は、この使命における重要なステップの一つです。Gen-2をRunwayで試してみてください。
まとめ
Gen-2は、動画生成の新しいスタンダードを提供します。テキストや画像を使って、想像を超えた動画を生成する力を持っています。ぜひ、公式サイトで最新情報を確認し、Gen-2の可能性を体験してみてください!