Основні поняття
문단 간 문맥 정보를 활용하여 문단 표현을 향상시키고, 이를 통해 질문에 가장 잘 답변할 수 있는 문단을 효율적으로 선별하는 모델을 제안한다.
Анотація
이 논문은 문단 재순위화 문제를 다룬다. 문단 재순위화는 질문에 가장 잘 답변할 수 있는 문단을 선별하는 작업이다. 기존 신경망 모델들은 문단 간 문맥 정보를 충분히 활용하지 못하는 한계가 있었다.
이 논문에서는 문단 간 문맥 정보를 활용하는 리스트 컨텍스트 주의 메커니즘을 제안한다. 이를 통해 각 문단의 표현을 보강하고, 질문과의 관련성을 더 잘 파악할 수 있다. 또한 메모리 사용량 문제를 해결하기 위해 2단계 선별 프로세스를 도입하였다.
구체적으로, 먼저 대략적인 선별을 수행하고, 이후 상세한 선별을 진행한다. 이 두 단계를 동시에 최적화하는 방식으로 모델을 학습한다. 실험 결과, 제안 모델이 기존 모델 대비 성능이 우수함을 보였다.
Статистика
질문 길이는 1~38단어, 평균 6.5단어이다.
문단 길이는 1~362단어, 평균 25.1단어이다.
각 질문당 평균 100.7개의 문단 후보가 있다.
Цитати
"문단 간 문맥 정보를 활용하여 문단 표현을 향상시키고, 이를 통해 질문에 가장 잘 답변할 수 있는 문단을 효율적으로 선별하는 모델을 제안한다."
"메모리 사용량 문제를 해결하기 위해 2단계 선별 프로세스를 도입하였다."