Core Concepts
그래프 신경망 사전 훈련의 가짜 뉴스 탐지에 대한 전략적 평가
Abstract
최근 자연어 처리 분야에서의 신경망 사전 훈련이 혁신을 가져왔으며, 컴퓨터 비전에서도 효과를 입증함.
가짜 뉴스 탐지 분야의 발전은 주로 컨텍스트 기반 패러다임에 의해 주도되었음.
그래프 신경망(GNNs)의 사전 훈련을 적용하여 컨텍스트 기반 가짜 뉴스 탐지 도메인에서 다양한 사전 훈련 전략을 평가하고 전이 학습이 현재 큰 개선을 이끌지 못하는 것을 보여줌.
현재 주요 문제는 사전 훈련에 사용할 수 있는 적합한 대규모 자원의 부족임.
연구는 FakeNewsNet 데이터셋을 사용하여 수행되었으며, 다양한 사전 훈련 작업이 가짜 뉴스 탐지 성능에 미치는 영향을 평가함.
실험 결과, 사전 훈련은 레이블된 데이터 양이 적을 때 모델 성능을 향상시킬 수 있음을 보여줌.
Stats
가짜 뉴스 탐지 작업에서 가장 큰 위험 요소 중 하나는 리소스의 부족이다.
FakeNewsNet 데이터셋은 Politifact(483 그래프) 및 Gossipcop(12,214 그래프)의 두 하위 집합으로 구성되어 있음.
사전 훈련 작업에서 배치 크기는 128이며, 50개의 에포크를 실행함.
Quotes
"가짜 뉴스 탐지 분야에서 GNN 사전 훈련의 대규모 자원 부족으로 인한 한계를 보여줌."
"레이블된 데이터 양이 적을 때 사전 훈련이 모델 성능을 향상시킬 수 있음을 실험적으로 입증함."