核心概念
질문에 답변하기 위해서는 여러 테이블에서 정보를 가져와야 하지만, 기존 방식은 이를 고려하지 않아 정확한 답변을 제공하지 못한다.
要約
이 논문은 질문에 답변하기 위해 필요한 정보가 여러 테이블에 분산되어 있는 경우, 이를 고려하여 테이블을 검색하는 방법을 제안한다.
기존 연구는 질문에 대한 답변이 단일 테이블에 있다고 가정하거나, 질문 분해를 통해 필요한 테이블을 찾는다. 그러나 이는 실제 상황에서 충분하지 않다. 많은 질문은 여러 테이블을 조인해야 답변할 수 있지만, 질문 자체에서는 이러한 조인 관계를 알 수 없기 때문이다.
이 논문에서는 테이블-질문 관련성과 테이블-테이블 관련성을 동시에 고려하는 재순위화 방법을 제안한다. 테이블-질문 관련성은 질문의 세부 내용과 테이블 컬럼의 관련성을 측정한다. 테이블-테이블 관련성은 테이블 간 조인 가능성을 측정한다. 이를 혼합 정수 계획법 문제로 정식화하여 최적의 테이블 집합을 선택한다.
실험 결과, 제안 방법이 기존 방법 대비 최대 9.3%의 F1 점수 향상과 5.4%의 정확도 향상을 보였다. 이는 제안 방법이 질문 답변을 위해 필요한 테이블을 더 정확하게 검색할 수 있음을 보여준다.
統計
질문에 필요한 정보가 여러 테이블에 분산되어 있는 경우가 많다.
기존 방식은 단일 테이블 검색 또는 질문 분해를 통한 테이블 검색을 가정하지만, 실제로는 이를 통해서는 정확한 답변을 얻기 어렵다.
제안 방법은 테이블-질문 관련성과 테이블-테이블 관련성을 동시에 고려하여 최적의 테이블 집합을 선택한다.
引用
"To answer a question or verify a fact relevant to structural tables, we may need multiple tables."
"Retrieving multiple tables requires understanding the relationship among candidate tables, which is independent of how the query is framed."
"Only if it understands the relationship among tables can the model determine which set of tables to return."