Основні поняття
최소한의 구조로 구성된 영상 품질 평가 모델을 설계하고, 이를 통해 기존 영상 품질 데이터셋의 특성을 분석하였다.
Анотація
본 연구는 영상 품질 평가(VQA) 모델 개선을 위해 기존 VQA 데이터셋의 특성을 분석하였다. 이를 위해 최소한의 구조로 구성된 BVQA(blind video quality assessment) 모델을 설계하였다.
모델은 비디오 전처리기, 공간 품질 분석기, 시간 품질 분석기, 품질 회귀기로 구성된다. 이 중 공간 품질 분석기와 시간 품질 분석기는 다양한 초기화 방법을 적용하여 비교하였다.
8개의 VQA 데이터셋에 대해 제안 모델을 평가한 결과, 대부분의 데이터셋이 쉬운 데이터셋 문제를 겪고 있음을 확인하였다. 즉, 공간 품질 분석만으로도 높은 성능을 달성할 수 있어, 시간적 특성이 충분히 반영되지 않았다. 이는 데이터셋 구축 시 고려되어야 할 사항이다.
추가로 제안 모델의 일반화 성능을 분석하고, BVQA 모델 설계 요소에 대한 실험을 수행하여 결과를 뒷받침하였다. 본 연구 결과는 향후 VQA 데이터셋 및 모델 구축을 위한 좋은 실천 방안을 제시한다.
Статистика
본 연구에서 사용한 8개의 VQA 데이터셋은 총 43,171개의 비디오로 구성되어 있다.
이 중 LSVQ 데이터셋이 38,811개로 가장 많은 비디오를 포함하고 있다.
비디오 해상도는 99p부터 4K까지 다양하며, 프레임률은 10fps부터 60fps까지 다양하다.
Цитати
"Nearly all datasets suffer from the easy dataset problem by satisfying the first criterion to varying degrees."
"Our results cast doubt on the current progress in BVQA, and meanwhile shed light on good practices of constructing next-generation VQA datasets and models."