DreamFusion: 2D拡散を使用したテキストから3Dへの変換

DreamFusion

DreamFusionは、事前に訓練された2D拡散モデルを使用して、テキストから高忠実度の3Dオブジェクトを生成するAI技術です。

DreamFusion: 2D拡散を使用したテキストから3Dへの変換

DreamFusionは、テキストから3Dオブジェクトを生成する革新的なAI技術です。この技術は、Google ResearchのBen Poole、UC BerkeleyのAjay Jain、Google ResearchのJonathan T. BarronとBen Mildenhallによって開発されました。彼らは、数十億の画像とテキストのペアで訓練された拡散モデルを基に、3D合成への適用を試みました。

従来の3D合成には、大規模なラベル付き3Dアセットのデータセットと、3Dデータのノイズ除去のための効率的なアーキテクチャが必要でしたが、これらは現時点では存在しません。DreamFusionは、これらの制限を回避するために、事前に訓練された2Dテキストから画像への拡散モデルを使用して、テキストから3D合成を行います。

この技術は、確率密度蒸留に基づく損失を導入し、2D拡散モデルをパラメトリック画像ジェネレーターの最適化のための事前分布として使用することを可能にします。この損失をDeepDreamのような手順で使用し、ランダムに初期化された3Dモデル(Neural Radiance Field、またはNeRF)を勾配降下法で最適化します。これにより、ランダムな角度からの2Dレンダリングが低損失を達成します。

結果として得られる3Dモデルは、任意の角度から表示したり、任意の照明で再照明したり、任意の3D環境に合成したりすることができます。このアプローチは、3Dトレーニングデータを必要とせず、画像拡散モデルに変更を加える必要もありません。これにより、事前に訓練された画像拡散モデルの有効性が実証されています。

DreamFusionは、キャプションが与えられると、高忠実度の外観、深度、法線を持つ再照明可能な3Dオブジェクトを生成します。オブジェクトはNeural Radiance Fieldとして表現され、Imagenなどの事前に訓練されたテキストから画像への拡散事前分布を活用します。

DreamFusionは、多様なキャプションからオブジェクトやシーンを生成します。完全なギャラリーでは、数百の生成されたアセットを検索することができます。生成されたNeRFモデルは、マーチングキューブアルゴリズムを使用してメッシュにエクスポートでき、3Dレンダラーやモデリングソフトウェアに簡単に統合できます。

DreamFusionは、キャプションが与えられると、Imagenと呼ばれるテキストから画像への生成モデルを使用して3Dシーンを最適化します。Score Distillation Sampling(SDS)を提案し、損失関数を最適化することで拡散モデルからサンプルを生成します。SDSにより、3D空間などの任意のパラメーター空間でサンプルを最適化することが可能です。DreamFusionは、Neural Radiance Fields(NeRFs)に似た3Dシーンパラメーター化を使用して、この微分可能なマッピングを定義します。

SDS単独でも合理的なシーン外観を生成しますが、DreamFusionはジオメトリを改善するための追加の正則化と最適化戦略を追加します。結果として得られる訓練されたNeRFsは、高品質の法線、表面ジオメトリ、深度を持ち、Lambertianシェーディングモデルで再照明可能です。

DreamFusionの代替ツール

Atlas

Atlas

AtlasはAIを使って高品質3Dコンテンツを生成するツール

ArchitectAI

ArchitectAI

ArchitectAIは超パワフルなAIデザインツールで、様々なスタイルを提供してユーザーをサポートするよ!

Yellow

Yellow

Yellowは専門的な3D AIツールで、ゲームメーカー等の創造力を高めます

Finch

Finch

FinchはAIを利用し建築設計を最適化するツール

ユニリアルエンジン

ユニリアルエンジン

ユニリアルエンジンは超クールな開発者向け3Dクリエイションツールで、様々な機能満載!

Getfloorplan

Getfloorplan

GetfloorplanはAIを使って2D、3Dフロアプランとバーチャルツアーを作成

Pietra

Pietra

Pietraは数秒でデザインとバリエーションを作成できる

openai/shap

openai/shap

openai/shap-eはテキストまたは画像に基づいて3Dオブジェクトを生成する

Babylon.js

Babylon.js

Babylon.jsは超パワフルなAI搭載の3Dウェブエンジンで、めっちゃ便利!

スプライン

スプライン

スプラインはリアルタイム協業可能な3Dデザインツールだよ

Alpha3D

Alpha3D

Alpha3Dはテキストと2D画像を3Dモデルに変換するAIツール

MagiScan

MagiScan

MagiScanはAI搭載の3Dスキャナーアプリで、高品質モデル作成を実現

Charmed

Charmed

CharmedはAIを使って3Dメッシュ、テクスチャ、アニメーションを生成するツール

CopernicAI

CopernicAI

CopernicAIはジェネレーティブAIで、3Dワールド生成を目指しています

Spline AI 3D Generation

Spline AI 3D Generation

Spline AI 3D Generationは、テキストプロンプトや画像から3Dオブジェクトを生成するAIパワーを活用したプラットフォームです。

SketchUp

SketchUp

SketchUpは、3Dモデリングと描画を可能にするAI支援デザインソフトウェアです。

MetaBrix

MetaBrix

MetaBrixは、ゲーム、XR、マーケティングのための3Dアバターを数分で生成するAIプラットフォームです。

Immersity AI

Immersity AI

Immersity AIは、デジタルイメージに深みを加え、平面画像やビデオを3D体験に変換するプラットフォームです。

Kaedim

Kaedim

Kaedimは、AIを活用した3Dコンテンツ作成プラットフォームで、ゲーム開発者が高品質なグラフィックスを迅速に作成できるように支援します。

Customuse

Customuse

Customuseは、プロフェッショナルな3Dモデル、ゲームアセット、ARレンズを無料で作成できるオールインワン編集ツールです。

VRoid Studio

VRoid Studio

VRoid Studioは、誰でも簡単に3Dキャラクターを作成できるAI搭載ソフトウェアです。

注目のAIツール

123看房

123看房

「123看房」は先進技術でVR撮影、3Dモデリングなどを実現

詳細を見る
Stable Fast 3D(SF3D)

Stable Fast 3D(SF3D)

Stable Fast 3D(SF3D)は、Stability AIによる最新のイノベーションで、単一の画像をわずか0.5秒で詳細な3Dアセットに変換します。

詳細を見る
CuriosityXR

CuriosityXR

CuriosityXRは、100万以上の3Dモデルを手にしたChatGPTのようなAIツールで、探求心と能動的な没入感を通じて学習を促進します。

詳細を見る
DreamFusion

DreamFusion

DreamFusionは、2D拡散モデルを使用してテキストから3D合成を行うAIツールです。

詳細を見る
Masterpiece X

Masterpiece X

AIを使って簡単に3Dモデルを生成できるツール。

詳細を見る
Meshy

Meshy

MeshyはAIを使って3Dモデルを作成でき、ユーザーの創造力を解き放つ

詳細を見る
Polycam

Polycam

Polycam は直感的で協働的な 3D スキャニングプラットフォームです

詳細を見る
Atlas

Atlas

AtlasはAIを使って高品質3Dコンテンツを生成するツール

詳細を見る