本論文では、ドラッグ編集の安定性と画質を向上させるGoodDragを提案する。
まず、既存のドラッグ編集手法は、一度にすべてのドラッグ操作を行い、その後に除雑音操作を行うため、大きな歪みが蓄積されてしまう問題がある。そこで、本手法では、ドラッグ操作とデノイジング操作を交互に行うAlDD フレームワークを提案する。これにより、大きな歪みの蓄積を防ぎ、より精緻な編集が可能となる。
次に、既存手法ではハンドルポイントの特徴が徐々に元の特徴から逸脱してしまう問題がある。これにより、正確なポイント操作ができなくなり、アーティファクトが生じる。そこで、ハンドルポイントの元の特徴を保持する情報保持型モーション監視を提案する。これにより、より自然で正確なドラッグ編集が可能となる。
さらに、ドラッグ編集の進捗を評価するための新しいデータセットDrag100と、大規模多モーダルモデルを活用した新しい評価指標Gemini Scoreを提案する。
これらの取り組みにより、GoodDragは既存手法を大幅に上回る高品質なドラッグ編集結果を実現している。
Başka Bir Dile
kaynak içeriğinden
arxiv.org
Önemli Bilgiler Şuradan Elde Edildi
by Zewei Zhang,... : arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.07206.pdfDaha Derin Sorular