핵심 개념
다양한 멀티모달 정보(게임 이벤트 로그, 캐스터 음성, 관중 채팅)를 활용하여 게임 상황을 이해하고 관중 참여형 해설을 생성하는 모델을 제안한다.
초록
이 논문은 게임 상황 이해와 관중 참여형 해설 생성을 위한 새로운 멀티모달 데이터셋 Game-MUG를 소개한다. 이 데이터셋은 2020년부터 2022년까지 LOL 게임 라이브 스트림에서 수집된 다양한 멀티모달 정보를 포함한다.
데이터셋 구성:
- 게임 이벤트 로그: 6가지 주요 이벤트(킬, 타워 파괴, 드래곤 처치 등) 정보
- 캐스터 음성 트랜스크립트: 캐스터의 실시간 해설 내용
- 관중 채팅: 게임 상황에 대한 관중들의 실시간 반응 및 감정 표현
이를 바탕으로 저자들은 게임 상황 이해와 해설 생성을 위한 강력한 베이스라인 모델을 제안한다. 이 모델은 멀티모달 정보를 통합하여 게임 상황을 이해하고, 이를 바탕으로 관중 참여형 해설을 생성한다. 실험 결과, 제안된 모델이 게임 상황 이해와 해설 생성 모두에서 우수한 성능을 보였다.
통계
게임 이벤트 중 킬 이벤트가 전체의 36.45%로 가장 많은 비중을 차지한다.
타워 파괴 이벤트는 전체의 18.98%, 드래곤 처치 이벤트는 10.81%를 차지한다.
인용구
"이 동적인 esports의 특성으로 인해 일반 관객들이 게임 상황을 완전히 이해하기 어렵다."
"기존 esports 게임 해설 데이터셋은 단일 모달리티 정보만을 활용하여 해설을 생성하였지만, 다양한 정보원을 활용하면 더 풍부한 해설을 생성할 수 있다."