본 연구는 AI 생성 이미지의 품질, 진정성 및 텍스트-이미지 대응을 평가하기 위한 효과적인 모델을 개발하는 것을 목표로 한다. 이를 위해 프롬프트 설계와 메트릭 트랜스포머라는 혁신적인 기술을 제안한다.
AI 생성 이미지의 품질을 평가할 때 이미지와 텍스트 프롬프트의 상호작용을 고려해야 한다. 이를 위해 Image2Prompt 사전 학습, 이미지-프롬프트 융합 모듈, [QA] 토큰 등을 활용한 IP-IQA 모델을 제안한다.