이 논문은 확산 모델 기반 드래그 편집 기법인 GoodDrag를 소개한다. 기존 방법들은 편집 과정에서 누적되는 왜곡으로 인해 낮은 안정성과 품질을 보였다. 이를 해결하기 위해 GoodDrag는 다음과 같은 두 가지 핵심 기법을 제안한다.
교대 드래그 및 디노이징(AlDD) 프레임워크: 기존 방법들이 한 번에 모든 드래그 작업을 수행한 뒤 디노이징을 적용했다면, AlDD는 드래그와 디노이징을 교대로 적용하여 큰 왜곡이 누적되는 것을 방지한다. 이를 통해 편집 결과의 충실도를 높일 수 있다.
정보 보존 모션 감독: 기존 방법들은 편집 과정에서 핸들 포인트의 특징이 원본과 점점 달라지는 문제가 있었다. GoodDrag는 핸들 포인트의 원본 특징을 유지하는 정보 보존 모션 감독 기법을 제안하여 이 문제를 해결한다. 이를 통해 편집 결과의 정확성과 자연스러움을 향상시킬 수 있다.
또한 이 논문은 드래그 편집 벤치마킹을 위한 Drag100 데이터셋과 DAI, GScore 평가 지표를 제안한다. 실험 결과, GoodDrag는 기존 방법들에 비해 편집 정확도와 이미지 품질 면에서 우수한 성능을 보였다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Zewei Zhang,... lúc arxiv.org 04-11-2024
https://arxiv.org/pdf/2404.07206.pdfYêu cầu sâu hơn