ByteEdit은 이미지 편집 작업을 위한 혁신적인 피드백 학습 프레임워크를 제안한다. 이 프레임워크는 미학, 이미지-텍스트 정렬, 픽셀 수준의 일관성을 향상시키기 위한 세 가지 독립적인 보상 모델을 설계한다. 또한 적대적 피드백 학습 전략과 점진적 학습 기법을 도입하여 모델의 추론 속도를 크게 향상시킨다. 대규모 사용자 평가를 통해 ByteEdit이 기존 최첨단 이미지 편집 제품들을 압도적으로 능가한다는 것을 입증한다. ByteEdit-Outpainting은 기준 모델 대비 품질과 일관성이 각각 388%와 135% 향상되었다. 가속 모델 실험에서도 품질과 일관성이 우수한 성능을 유지하는 것으로 확인되었다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究