核心概念
テキストガイド型の生成モデルを使って、機能的な3Dマインクラフト環境を生成する。
摘要
本研究では、DreamCraftと呼ばれる新しい手法を提案している。DreamCraftは、テキストの説明に基づいて、マインクラフトの離散的なブロックを使って機能的な3D環境を生成する。
具体的には以下のような特徴がある:
- 量子化されたニューラルラジアンスフィールド(NeRF)を使って、テキストの説明に合致する3D構造を生成する。
- ブロックの種類や密度を連続的または離散的に表現することで、生成物の品質とファンクショナリティのバランスを取る。
- ブロックの分布や隣接関係に関する制約を損失関数に組み込むことで、機能的な制約を満たす環境を生成できる。
DreamCraftは、テキストガイド型の生成モデルの高い柔軟性と表現力を継承しつつ、ファンクショナリティの制約も取り入れることができる。これにより、ゲームデザインや強化学習環境の生成などの応用が期待できる。
统计
DreamCraftは、テキストの説明に基づいて生成した3D構造がUnconstrainedNeRFの生成物と視覚的に似ている。
DreamCraftの生成物は、ドメイン固有のテキストプロンプトを使った場合に、一般的なプロンプトを使った場合よりも、元のテキストとの一致度が高い。
DreamCraftの生成物を実際のマインクラフト環境で評価すると、Unconstrainedネットワークの離散化出力よりも高い一致度を示す。
引用
"DreamCraftは、テキストガイド型の生成モデルの高い柔軟性と表現力を継承しつつ、ファンクショナリティの制約も取り入れることができる。"
"DreamCraftの生成物は、ドメイン固有のテキストプロンプトを使った場合に、一般的なプロンプトを使った場合よりも、元のテキストとの一致度が高い。"