แนวคิดหลัก
본 논문에서는 사전 훈련된 Diffusion Model이 희귀 개념을 생성하는 데 어려움을 겪는 문제를 해결하기 위해 LLM(Large Language Model)을 활용하여 희귀 개념을 빈번한 개념으로 변환하여 학습 없이도 이미지 생성 품질을 향상시키는 R2F(Rare-to-Frequent) 프레임워크를 제안합니다.
บทคัดย่อ
LLM 기반 희귀 개념 가이드를 활용한 Diffusion Model의 구성적 생성 능력 향상: 희귀 개념에서 빈번한 개념으로 (R2F) 연구 논문 요약
Park, D., Kim, S., Moon, T., Kim, M., Lee, K., & Cho, J. (2024). RARE-TO-FREQUENT: UNLOCKING COMPOSITIONAL GENERATION POWER OF DIFFUSION MODELS ON RARE CONCEPTS WITH LLM GUIDANCE. arXiv preprint arXiv:2410.22376.
본 연구는 최첨단 Text-to-Image (T2I) Diffusion Model이 "털복숭이 개구리" 또는 "도끼 모양의 기타"와 같이 흔하지 않은 개념이나 속성을 결합하여 이미지를 생성하는 데 어려움을 겪는 문제를 해결하고자 합니다.