Core Concepts
공동 창작 시스템의 출력물 평가를 위해 품질과 더불어 다양성이 중요한 지표가 될 수 있다. 이를 위해 사전 학습된 신경망 인코딩의 엔트로피를 기반으로 한 다양성 측정 방법을 제안한다.
Abstract
이 논문에서는 공동 창작 이미지 생성 시스템의 출력물을 평가하기 위한 새로운 방법을 제안한다. 기존의 품질 측정 방법에 더해 다양성 측정이 중요하다고 주장한다.
먼저 다양성의 개념을 정의하고, 이를 측정하기 위한 두 가지 방법을 제안한다. 첫 번째는 InceptionV3 네트워크의 인코딩을 활용한 Truncated Inception Entropy(TIE), 두 번째는 CLIP 네트워크의 인코딩을 활용한 Truncated CLIP Entropy(TCE)이다. 이 두 방법은 사전 학습된 네트워크의 잠재 공간에서 생성된 이미지 집합의 엔트로피를 계산함으로써 다양성을 측정한다.
실험에서는 다양한 방식으로 생성된 이미지 집합을 대상으로 TIE와 TCE를 계산하여 그 결과를 비교한다. 결과는 기대했던 바와 일치하여, 제안한 방법이 다양성을 효과적으로 측정할 수 있음을 보여준다. 또한 TIE와 TCE가 다양성을 다른 관점에서 평가한다는 것을 확인할 수 있었다.
이 연구는 공동 창작 시스템의 출력물 평가에 다양성 측정이 중요함을 강조하고, 이를 위한 실용적이고 일반화 가능한 방법을 제시한다는 점에서 의의가 있다.
Stats
생성된 이미지 집합의 다양성은 입력 프롬프트의 다양성에 따라 달라진다.
고정된 프롬프트에 대한 낮은 노이즈 이미지 집합의 다양성이 가장 낮게 나타났다.
일반적인 장소에 있는 물체의 이미지 집합보다 비일반적인 장소에 있는 물체의 이미지 집합의 다양성이 더 높게 나타났다.
동일한 장면을 다양한 스타일로 렌더링한 이미지 집합의 경우 TIE와 TCE가 다른 결과를 보였다.
Quotes
"품질과 다양성은 공동 창작 시스템의 출력물을 평가하기 위한 합리적인 휴리스틱으로 제안되어 왔지만, 지금까지 다양성의 정의와 측정 방법에 대한 합의가 부족했다."
"우리는 사전 학습된 신경망 인코딩의 엔트로피를 기반으로 한 대안적인 방법을 제안한다. 이 방법은 기준 데이터를 요구하지 않으며 계산이 쉽다."