이 연구는 이미지를 다양한 구성 요소로 분해하고, 각 요소에 대한 텍스트 프롬프트를 활용하여 이미지를 생성하는 방법을 제안한다. 이를 통해 다음과 같은 지각 착시 효과를 구현할 수 있다:
하이브리드 이미지: 원거리에서는 저주파 성분이 두드러지고 근거리에서는 고주파 성분이 부각되는 이미지를 생성한다. 이는 Oliva et al.의 고전적인 연구를 확장한 것이다.
트리플 하이브리드: 이미지를 3개의 주파수 대역으로 분해하고, 각 대역에 대한 서로 다른 텍스트 프롬프트를 적용하여 3개의 객체가 혼합된 이미지를 생성한다.
컬러 하이브리드: 이미지의 명도와 색상 성분을 분리하여 제어함으로써, 컬러 이미지를 흑백으로 보았을 때 다른 모습으로 보이는 효과를 구현한다.
모션 하이브리드: 이미지에 블러 커널을 적용하여 분해하고, 각 성분에 대한 텍스트 프롬프트를 이용해 움직임에 따라 변화하는 이미지를 생성한다.
이 방법은 기존 접근법과 달리 별도의 학습이나 보조 네트워크 없이도 다양한 지각 착시 효과를 구현할 수 있다는 장점이 있다. 또한 실제 이미지에서 특정 성분을 추출하고 나머지 성분을 생성하는 방식으로 하이브리드 이미지를 만들어낼 수 있다.
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Daniel Geng,... um arxiv.org 04-18-2024
https://arxiv.org/pdf/2404.11615.pdfTiefere Fragen