BIFRÖST는 텍스트 명령어를 기반으로 3D 공간 관계를 고려하여 사실적인 이미지 합성을 수행하는 혁신적인 3D 인식 프레임워크입니다.
본 논문에서는 머신 비전 기반 금속 표면 검사를 위한 사실적인 합성 데이터 생성 파이프라인인 SYNOSIS를 제안하고, 실제 데이터와 합성 데이터를 포함한 포괄적인 데이터셋을 제공하여 합성 데이터의 효용성을 입증합니다.
본 연구는 Stable Diffusion XL을 사용하여 지각적으로 구분되지만 의미적으로 일관된 자연 이미지 세트를 생성하는 새로운 방법을 제시하고, 온라인 심리 물리학적 작업을 통해 생성된 이미지 세트의 순서를 검증하여 시각 인지 연구를 위한 효과적인 도구임을 보여줍니다.
SANA는 4096x4096 해상도까지 이미지를 효율적으로 생성할 수 있는 텍스트-이미지 프레임워크로, 고해상도, 고품질 이미지를 빠른 속도로 합성하고 랩톱 GPU에서도 배포 가능합니다.
본 논문에서는 GAN 기반 모델과 폐쇄형 인수분해를 활용하여 사실적인 피부 병변 이미지를 합성 생성하고, 이를 통해 피부암 진단 모델의 성능을 향상시키는 새로운 방법론을 제시합니다.
옴니부스는 텍스트 프롬프트나 이미지 참조와 같은 다중 모달 명령어를 통해 이미지 합성에서 인스턴스 수준의 공간 제어를 가능하게 하는 새로운 프레임워크입니다.
클러스터 조건부 확산 모델을 사용하여 이미지 합성의 최적 클러스터 세분화 수준을 탐색하고, 상태-of-the-art FID를 달성하는 방법을 제시합니다.