이 연구는 HQ-Edit라는 고품질의 지침 기반 이미지 편집 데이터셋을 소개한다. 기존 데이터셋은 낮은 해상도, 부정확한 편집-이미지 정렬, 제한적인 편집 유형 등의 한계가 있었다.
HQ-Edit는 GPT-4와 DALL-E 3와 같은 최신 기반 모델을 활용하여 자동으로 생성된다. 데이터 수집 과정은 다음과 같다:
또한 HQ-Edit의 품질을 평가하기 위해 Alignment와 Coherence라는 두 가지 새로운 평가 지표를 도입했다. 실험 결과, HQ-Edit로 fine-tuning된 InstructPix2Pix 모델이 기존 모델 대비 Alignment 12.3, Coherence 5.64 향상을 보였다. 이는 HQ-Edit의 우수한 데이터 품질을 입증한다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Mude Hui,Siw... at arxiv.org 04-16-2024
https://arxiv.org/pdf/2404.09990.pdfDeeper Inquiries