DreamFusion: 2D拡散を使用したテキストから3Dへの変換

DreamFusion

DreamFusionは、事前に訓練された2D拡散モデルを使用して、テキストから高忠実度の3Dオブジェクトを生成するAI技術です。

DreamFusion: 2D拡散を使用したテキストから3Dへの変換

DreamFusionは、テキストから3Dオブジェクトを生成する革新的なAI技術です。この技術は、Google ResearchのBen Poole、UC BerkeleyのAjay Jain、Google ResearchのJonathan T. BarronとBen Mildenhallによって開発されました。彼らは、数十億の画像とテキストのペアで訓練された拡散モデルを基に、3D合成への適用を試みました。

従来の3D合成には、大規模なラベル付き3Dアセットのデータセットと、3Dデータのノイズ除去のための効率的なアーキテクチャが必要でしたが、これらは現時点では存在しません。DreamFusionは、これらの制限を回避するために、事前に訓練された2Dテキストから画像への拡散モデルを使用して、テキストから3D合成を行います。

この技術は、確率密度蒸留に基づく損失を導入し、2D拡散モデルをパラメトリック画像ジェネレーターの最適化のための事前分布として使用することを可能にします。この損失をDeepDreamのような手順で使用し、ランダムに初期化された3Dモデル(Neural Radiance Field、またはNeRF)を勾配降下法で最適化します。これにより、ランダムな角度からの2Dレンダリングが低損失を達成します。

結果として得られる3Dモデルは、任意の角度から表示したり、任意の照明で再照明したり、任意の3D環境に合成したりすることができます。このアプローチは、3Dトレーニングデータを必要とせず、画像拡散モデルに変更を加える必要もありません。これにより、事前に訓練された画像拡散モデルの有効性が実証されています。

DreamFusionは、キャプションが与えられると、高忠実度の外観、深度、法線を持つ再照明可能な3Dオブジェクトを生成します。オブジェクトはNeural Radiance Fieldとして表現され、Imagenなどの事前に訓練されたテキストから画像への拡散事前分布を活用します。

DreamFusionは、多様なキャプションからオブジェクトやシーンを生成します。完全なギャラリーでは、数百の生成されたアセットを検索することができます。生成されたNeRFモデルは、マーチングキューブアルゴリズムを使用してメッシュにエクスポートでき、3Dレンダラーやモデリングソフトウェアに簡単に統合できます。

DreamFusionは、キャプションが与えられると、Imagenと呼ばれるテキストから画像への生成モデルを使用して3Dシーンを最適化します。Score Distillation Sampling(SDS)を提案し、損失関数を最適化することで拡散モデルからサンプルを生成します。SDSにより、3D空間などの任意のパラメーター空間でサンプルを最適化することが可能です。DreamFusionは、Neural Radiance Fields(NeRFs)に似た3Dシーンパラメーター化を使用して、この微分可能なマッピングを定義します。

SDS単独でも合理的なシーン外観を生成しますが、DreamFusionはジオメトリを改善するための追加の正則化と最適化戦略を追加します。結果として得られる訓練されたNeRFsは、高品質の法線、表面ジオメトリ、深度を持ち、Lambertianシェーディングモデルで再照明可能です。

DreamFusionの代替ツール

Atlas

Atlas

AtlasはAIを使って高品質3Dコンテンツを生成するツール

ArchitectAI

ArchitectAI

ArchitectAIは超パワフルなAIデザインツールで、様々なスタイルを提供してユーザーをサポートするよ!

Yellow

Yellow

Yellowは専門的な3D AIツールで、ゲームメーカー等の創造力を高めます

Finch

Finch

FinchはAIを利用し建築設計を最適化するツール

ユニリアルエンジン

ユニリアルエンジン

ユニリアルエンジンは超クールな開発者向け3Dクリエイションツールで、様々な機能満載!

Getfloorplan

Getfloorplan

GetfloorplanはAIを使って2D、3Dフロアプランとバーチャルツアーを作成

Pietra

Pietra

Pietraは数秒でデザインとバリエーションを作成できる

openai/shap

openai/shap

openai/shap-eはテキストまたは画像に基づいて3Dオブジェクトを生成する

Babylon.js

Babylon.js

Babylon.jsは超パワフルなAI搭載の3Dウェブエンジンで、めっちゃ便利!

スプライン

スプライン

スプラインはリアルタイム協業可能な3Dデザインツールだよ

Alpha3D

Alpha3D

Alpha3Dはテキストと2D画像を3Dモデルに変換するAIツール

MagiScan

MagiScan

MagiScanはAI搭載の3Dスキャナーアプリで、高品質モデル作成を実現

Charmed

Charmed

CharmedはAIを使って3Dメッシュ、テクスチャ、アニメーションを生成するツール

CopernicAI

CopernicAI

CopernicAIはジェネレーティブAIで、3Dワールド生成を目指しています

Spline AI 3D Generation

Spline AI 3D Generation

Spline AI 3D Generationは、テキストプロンプトや画像から3Dオブジェクトを生成するAIパワーを活用したプラットフォームです。

SketchUp

SketchUp

SketchUpは、3Dモデリングと描画を可能にするAI支援デザインソフトウェアです。

MetaBrix

MetaBrix

MetaBrixは、ゲーム、XR、マーケティングのための3Dアバターを数分で生成するAIプラットフォームです。

Immersity AI

Immersity AI

Immersity AIは、デジタルイメージに深みを加え、平面画像やビデオを3D体験に変換するプラットフォームです。

Kaedim

Kaedim

Kaedimは、AIを活用した3Dコンテンツ作成プラットフォームで、ゲーム開発者が高品質なグラフィックスを迅速に作成できるように支援します。

Customuse

Customuse

Customuseは、プロフェッショナルな3Dモデル、ゲームアセット、ARレンズを無料で作成できるオールインワン編集ツールです。

VRoid Studio

VRoid Studio

VRoid Studioは、誰でも簡単に3Dキャラクターを作成できるAI搭載ソフトウェアです。

注目のAIツール

Sortium

Sortium

Sortiumは、リアルタイムでテクスチャや3Dアセットを生成または変更できるAIパワードのプロダクションチームです。

詳細を見る
Daz 3D

Daz 3D

Daz 3Dは、無料の3Dソフトウェアとキャラクタークリエーターを提供し、ユーザーが独自の3Dシーンやキャラクターを簡単に作成できるようにします。

詳細を見る
Loci

Loci

Lociは、3Dアセットとシーンから実用的なデータを抽出するAIパワードAPIを提供し、ラベル付け、カテゴライズ、推奨、最適化を大規模に行います。

詳細を見る
Plask Motion

Plask Motion

Plask Motionは、AIを活用したモーションキャプチャー技術で、簡単なビデオからプロフェッショナルな3Dアニメーションを作成するツールです。

詳細を見る
Three.js

Three.js

Three.js は JavaScript で 3D を実現するパワフルなライブラリです

詳細を見る
Tripo AI

Tripo AI

Tripo AIは、テキストや画像から瞬時に3Dモデルを生成するツールです。

詳細を見る
3DFY.ai

3DFY.ai

3DFY.aiは、革新的な3Dコンテンツ生成を実現するAIツールです。

詳細を見る
Masterpiece X

Masterpiece X

AIを使って簡単に3Dモデルを生成できるツール。

詳細を見る