Core Concepts
OMG는 다중 개념을 포함하는 단일 이미지를 자연스럽게 생성하는 폐색 친화적 개인화 프레임워크를 제안한다. 이를 위해 레이아웃 생성과 시각적 이해 정보 수집을 위한 2단계 샘플링 솔루션을 제안하며, 개념 노이즈 블렌딩 기법을 통해 개념 간 정체성 보존과 조명 조화를 달성한다.
Abstract
OMG는 다중 개념 개인화를 위한 2단계 프레임워크를 제안한다.
첫 번째 단계에서는 사용자가 제공한 텍스트 프롬프트를 기반으로 일관된 레이아웃의 이미지를 생성하고, 폐색 처리를 위한 시각적 이해 정보(주의 맵, 개념 마스크 등)를 수집한다.
두 번째 단계에서는 수집된 시각적 이해 정보와 개념 노이즈 블렌딩 기법을 활용하여 다중 개념을 자연스럽게 통합한다. 개념 노이즈 블렌딩은 각 개념 모델이 특정 영역을 담당하도록 하여 정체성 저하를 방지한다. 또한 노이즈 주입 시작 시점 제어를 통해 조명 조화를 달성한다.
OMG는 LoRA, InstantID 등 다양한 단일 개념 모델과 호환되며, 추가 학습 없이 플러그 앤 플레이 방식으로 활용할 수 있다. 실험 결과 OMG가 기존 방법 대비 우수한 성능을 보였다.
Stats
개념 간 폐색 상황에서도 일관된 레이아웃과 조명 조화를 유지할 수 있다.
다중 개념 생성 시 정체성 저하를 방지할 수 있다.
추가 학습 없이 다양한 단일 개념 모델과 호환 가능하다.
Quotes
"OMG는 다중 개념을 포함하는 단일 이미지를 자연스럽게 생성하는 폐색 친화적 개인화 프레임워크를 제안한다."
"개념 노이즈 블렌딩은 각 개념 모델이 특정 영역을 담당하도록 하여 정체성 저하를 방지한다."
"노이즈 주입 시작 시점 제어를 통해 조명 조화를 달성한다."