비전-언어 모델(VLM)을 활용하여 합성 이미지를 정확하게 탐지할 수 있는 혁신적인 방법인 Bi-LORA를 소개한다. 이 방법은 이미지 캡션 생성을 통해 실제 이미지와 합성 이미지를 구분하며, 특히 기존 방식에 비해 확산 모델(diffusion model)로 생성된 이미지에 대한 탐지 성능이 우수하다.