Keskeiset käsitteet
OSASIS는 이미지의 구조와 의미를 효과적으로 분리하여, 입력 이미지의 구조를 보존하면서도 참조 이미지의 스타일을 전이할 수 있는 방법을 제안한다.
Tiivistelmä
이 논문은 단일 참조 이미지를 활용하여 입력 이미지의 구조를 보존하면서도 스타일을 전이할 수 있는 OSASIS 방법을 제안한다.
주요 내용은 다음과 같다:
- 구조 정보와 의미 정보를 분리하기 위해 구조 잠재 코드와 의미 잠재 코드를 사용한다.
- 참조 이미지의 의미 잠재 코드를 활용하여 입력 이미지에 스타일을 전이하되, 구조 잠재 코드를 통해 입력 이미지의 구조를 보존한다.
- 구조 보존 네트워크(SPN)를 도입하여 구조 잠재 코드의 구조 정보 손실을 방지한다.
- CLIP 방향 손실 함수를 활용하여 참조 이미지와 입력 이미지 간의 의미 정보 정렬을 수행한다.
- 최적화된 의미 잠재 코드를 활용하여 텍스트 기반 이미지 조작을 수행할 수 있다.
실험 결과, OSASIS는 다른 방법들에 비해 입력 이미지의 구조를 더 잘 보존하면서도 효과적인 스타일 전이를 수행할 수 있음을 보여준다.
Tilastot
입력 이미지와 참조 이미지 간의 구조 유사도는 LPIPS 지표를 통해 측정할 수 있다.
저밀도 영역의 입력 이미지는 LPIPS 지표가 높게 나타나, 구조가 복잡하고 드물게 등장하는 속성을 가지고 있다.
Lainaukset
"OSASIS는 이미지의 구조와 의미를 효과적으로 분리할 수 있어, 입력 이미지의 구조를 보존하면서도 참조 이미지의 스타일을 전이할 수 있다."
"구조 보존 네트워크(SPN)를 도입하여 구조 잠재 코드의 구조 정보 손실을 방지할 수 있다."
"CLIP 방향 손실 함수를 활용하여 참조 이미지와 입력 이미지 간의 의미 정보 정렬을 수행할 수 있다."