Core Concepts
실시간 경기 중계 텍스트에서 정보 추출, 추론 및 통합을 통해 요약 표를 생성하는 것이 핵심 목표이다.
Abstract
이 논문은 실시간 경기 중계 텍스트에서 요약 표를 생성하는 새로운 벤치마크 데이터셋 LIVESUM을 소개한다. LIVESUM은 기존 데이터셋과 달리 텍스트에서 정보를 추출, 추론 및 통합하는 능력을 평가한다.
논문에서는 또한 T3(Text-Tuple-Table) 파이프라인을 제안하여 이 과제를 해결한다. T3는 텍스트에서 관련 튜플을 추출하고, 이를 통합한 후 표로 생성하는 3단계 프로세스로 구성된다.
실험 결과, 현재 최신 LLM(Large Language Model)들은 LIVESUM 데이터셋에서 미흡한 성능을 보이지만, T3 파이프라인을 적용하면 상당한 성능 향상을 달성할 수 있다. 또한 T3는 다른 실제 세계 데이터셋에도 효과적으로 적용될 수 있음을 보여준다.
Stats
Player5가 홈팀을 위해 근거리에서 왼쪽 하단 구석으로 슈팅하여 득점했다.
Player2가 홈팀을 위해 박스 중앙에서 헤더 슈팅을 놓쳤다.
홈팀이 1-0으로 리드하며 득점했다.
Quotes
"Goal!!! 홈팀이 1-0으로 리드하고 있습니다!"
"Player5가 침착하게 오른발 슈팅으로 득점했습니다."