本論文では、スコアディストリビューションに基づくテキストから3Dコンテンツ生成手法の問題点を明らかにし、それを解決するための新しい手法を提案している。
まず、既存のスコアディストリビューションの手法は、各ビューを独立に最尤推定することで、モードコラプスに陥ることを理論的に示した。これにより、生成された3Dオブジェクトにジャヌス問題と呼ばれる複数の正面が存在する問題が生じる。
そこで本論文では、エントロピー正則化を導入したエントロピースコアディストリビューション(ESD)を提案した。ESEは、レンダリングされた画像分布のエントロピーを最大化することで、ビューの多様性を高め、ジャヌス問題を緩和する。理論的な分析から、ESEはクラシファイアフリーガイダンス手法を用いて簡単に実装できることを示した。
実験の結果、ESEは既存手法と比べて、生成された3Dオブジェクトの品質とビューの多様性が大幅に向上することを示した。また、提案手法は他の手法と組み合わせることで、さらなる性能向上が期待できることも示された。
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Peihao Wang,... klokken arxiv.org 04-02-2024
https://arxiv.org/pdf/2401.00909.pdfDypere Spørsmål