Core Concepts
MMTryon은 텍스트 지시와 다중 의상 이미지를 활용하여 고품질의 가상 피팅 결과를 생성할 수 있는 모델이다.
Abstract
MMTryon은 기존 가상 피팅 모델의 한계를 극복하기 위해 개발된 모델이다. 기존 모델들은 단일 의상 피팅에 국한되어 있고 의상 착용 스타일을 제어하기 어려웠다. 이에 반해 MMTryon은 다중 의상 피팅과 텍스트 기반 스타일 제어 기능을 제공한다.
MMTryon의 핵심 구성요소는 다음과 같다:
다중 모달리티와 다중 참조 어텐션 메커니즘: 텍스트 지시와 의상 이미지를 융합하여 의상 정보와 착용 스타일을 모두 반영할 수 있다.
파싱 없는 의상 인코더: 사전 학습된 분할 모델에 의존하지 않고 텍스트 정보만으로 의상 영역을 추출할 수 있다.
확장 가능한 데이터 생성 파이프라인: 기존 데이터셋의 한계를 극복하고 다양한 의상 조합과 스타일을 포함하는 데이터를 생성한다.
이를 통해 MMTryon은 기존 모델 대비 더 높은 품질의 가상 피팅 결과를 생성할 수 있으며, 다양한 의상 조합과 스타일 제어가 가능하다.
Stats
다양한 의상 조합을 통해 고품질의 가상 피팅 결과를 생성할 수 있다.
텍스트 지시를 활용하여 의상 착용 스타일(지퍼 여닫기, 셔츠 넣기/빼기 등)을 제어할 수 있다.
기존 분할 모델에 의존하지 않고 텍스트 정보만으로 의상 영역을 추출할 수 있다.
Quotes
"MMTryon은 다중 의상 피팅과 텍스트 기반 스타일 제어 기능을 제공하여 기존 모델의 한계를 극복한다."
"MMTryon의 파싱 없는 의상 인코더와 확장 가능한 데이터 생성 파이프라인은 더 높은 품질의 가상 피팅 결과를 가능하게 한다."