Centrala begrepp
본 연구는 다중 작업 혼합 목적 학습 프레임워크를 기반으로 한 고급 반복 다중 홉 밀집 문장 검색 시스템 M3를 제안한다. M3는 기존 방법들의 한계를 해결하고 FEVER 벤치마크 데이터셋에서 최신 성능을 달성한다.
Sammanfattning
이 논문은 개방 도메인 사실 검증 작업을 위한 효율적인 문장 검색 시스템 M3를 소개한다. 기존 문서 수준 검색 모델의 한계를 극복하기 위해 문장 수준 검색을 수행하며, 다중 작업 학습과 혼합 목적 학습을 통해 더 나은 문장 표현을 학습한다. 또한 단일 홉과 다중 홉 검색 결과를 효과적으로 결합하는 동적 하이브리드 랭킹 알고리즘을 제안한다. 실험 결과, M3는 FEVER 벤치마크 데이터셋에서 최신 성능을 달성했다.
Statistik
개방 도메인 사실 검증 작업에서 단일 홉 및 다중 홉 문장 수준 증거가 필요하다.
FEVER 데이터셋은 185,455개의 주장과 5,416,537개의 위키피디아 문서로 구성되어 있다.
각 문서는 평균 5개의 문장으로 이루어져 있다.
Citat
"현재 밀집 정보 검색 모델은 단순히 대조 학습에 의존하고 있어 최적의 검색 성능을 달성하지 못하고 있다."
"다양한 학습 목표를 지원하는 많은 검색 데이터셋이 있지만, 다중 작업 학습 시나리오에서 효율적으로 결합하는 것은 어려운 과제이다."