본 연구는 영상 품질 평가(VQA) 모델 개선을 위해 기존 VQA 데이터셋의 특성을 분석하였다. 이를 위해 최소한의 구조로 구성된 BVQA(blind video quality assessment) 모델을 설계하였다.
모델은 비디오 전처리기, 공간 품질 분석기, 시간 품질 분석기, 품질 회귀기로 구성된다. 이 중 공간 품질 분석기와 시간 품질 분석기는 다양한 초기화 방법을 적용하여 비교하였다.
8개의 VQA 데이터셋에 대해 제안 모델을 평가한 결과, 대부분의 데이터셋이 쉬운 데이터셋 문제를 겪고 있음을 확인하였다. 즉, 공간 품질 분석만으로도 높은 성능을 달성할 수 있어, 시간적 특성이 충분히 반영되지 않았다. 이는 데이터셋 구축 시 고려되어야 할 사항이다.
추가로 제안 모델의 일반화 성능을 분석하고, BVQA 모델 설계 요소에 대한 실험을 수행하여 결과를 뒷받침하였다. 본 연구 결과는 향후 VQA 데이터셋 및 모델 구축을 위한 좋은 실천 방안을 제시한다.
Til et annet språk
fra kildeinnhold
arxiv.org
Viktige innsikter hentet fra
by Wei Sun,Wen ... klokken arxiv.org 04-04-2024
https://arxiv.org/pdf/2307.13981.pdfDypere Spørsmål