Core Concepts
BOND는 지역 및 전역 정보 신호를 상호 강화하는 엔드-투-엔드 방식으로 이름 구분 문제를 해결한다.
Abstract
이 논문은 웹 규모의 학술 이름 구분 문제를 다룹니다. 기존 방법은 지역 유사도 학습과 전역 클러스터링을 분리된 단계로 접근했지만, 이로 인해 정보 교환이 제한되어 최적의 성능을 달성하기 어려웠습니다.
BOND는 이를 해결하기 위해 지역 유사도 학습과 전역 클러스터링을 상호 강화하는 엔드-투-엔드 프레임워크를 제안합니다. 구체적으로:
다중 관계 그래프를 구축하여 논문 간 다양한 관계를 포착합니다.
그래프 자동 인코더와 그래프 주의 신경망을 활용하여 논문 표현을 학습하고 지역 유사도를 추정합니다.
DBSCAN 클러스터링을 통해 전역 클러스터링 결과를 생성하고, 이를 다시 지역 유사도 학습에 활용하는 상호 강화 방식을 적용합니다.
실험 결과, BOND는 기존 최고 성능 모델 대비 2.1%p 향상된 F1 점수를 달성했습니다. 또한 앙상블 및 사후 매칭 기법을 추가한 BOND+는 WhoIsWho 리더보드 1위를 차지했습니다.
Stats
현재 DBLP에는 컴퓨터 과학 분야에만 300명 이상의 "Wei Wang" 저자 프로필이 존재합니다.
BOND는 기존 최고 성능 모델 대비 2.1%p 향상된 F1 점수를 달성했습니다.
Quotes
"웹 규모의 학술 이름 구분 문제는 디지털 도서관 구축을 위해 근본적으로 중요합니다."
"기존 방법은 지역 유사도 학습과 전역 클러스터링을 분리된 단계로 접근했지만, 이로 인해 정보 교환이 제한되어 최적의 성능을 달성하기 어려웠습니다."