본 논문에서는 기존 축구 경기 해설 데이터 세트의 시간적 부정합 문제를 해결하여 자동으로 전문적인 수준의 해설을 생성하는 모델을 제안합니다.
This paper introduces a novel approach to generating accurate and contextually relevant soccer game commentary by addressing the crucial issue of temporal misalignment between video footage and textual descriptions in existing datasets.