Core Concepts
TIP-Editorは、テキストプロンプトとイメージプロンプトの両方を受け入れ、3Dバウンディングボックスを使用して編集領域を指定することで、指定された外観と位置の編集結果を正確に制御できる。
Abstract
TIP-Editorは、テキストプロンプトとイメージプロンプトの両方を受け入れ、3Dバウンディングボックスを使用して編集領域を指定することで、より正確な編集を可能にする。
具体的には以下の特徴がある:
シーンパーソナライゼーションステップでは、ロケーションロスを提案し、正確な物体配置を奨励する。
新しいコンテンツのパーソナライゼーションステップでは、LoRAを使用して参照イメージの特徴をより良く捉える。
3D Gaussian Splattingを3D表現として採用し、背景を変更せずにローカル編集を容易にする。
広範な実験により、TIP-Editorは文字プロンプトとイメージプロンプトに従って指定された領域内で正確な編集を行い、質的および量的に優れた結果を示すことが実証された。