이 논문은 확산 모델 기반 드래그 편집 기법인 GoodDrag를 소개한다. 기존 방법들은 편집 과정에서 누적되는 왜곡으로 인해 낮은 안정성과 품질을 보였다. 이를 해결하기 위해 GoodDrag는 다음과 같은 두 가지 핵심 기법을 제안한다.
교대 드래그 및 디노이징(AlDD) 프레임워크: 기존 방법들이 한 번에 모든 드래그 작업을 수행한 뒤 디노이징을 적용했다면, AlDD는 드래그와 디노이징을 교대로 적용하여 큰 왜곡이 누적되는 것을 방지한다. 이를 통해 편집 결과의 충실도를 높일 수 있다.
정보 보존 모션 감독: 기존 방법들은 편집 과정에서 핸들 포인트의 특징이 원본과 점점 달라지는 문제가 있었다. GoodDrag는 핸들 포인트의 원본 특징을 유지하는 정보 보존 모션 감독 기법을 제안하여 이 문제를 해결한다. 이를 통해 편집 결과의 정확성과 자연스러움을 향상시킬 수 있다.
또한 이 논문은 드래그 편집 벤치마킹을 위한 Drag100 데이터셋과 DAI, GScore 평가 지표를 제안한다. 실험 결과, GoodDrag는 기존 방법들에 비해 편집 정확도와 이미지 품질 면에서 우수한 성능을 보였다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Zewei Zhang,... a las arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.07206.pdfConsultas más profundas