본 연구는 측면 범주 탐지(Aspect Category Detection, ACD) 문제를 해결하기 위해 심층 신경망(Deep Neural Network, DNN)과 단계적 기계 학습(Gradual Machine Learning, GML) 기법을 결합한 새로운 접근법을 제안한다.
먼저, 최신 DNN 기반 ACD 모델을 활용하여 문장 간 유사도를 기반으로 한 의미적 관계를 추출한다. 이와 함께 BERT 기반 이진 모델을 통해 각 범주에 대한 문장 간 유사성 또는 대립성을 예측한다. 이렇게 추출된 의미적 관계는 요인 그래프에서 이진 특징으로 모델링된다.
다음으로, 레이블이 있는 쉬운 인스턴스(레이블이 있는 학습 데이터)에서 시작하여 점진적으로 더 어려운 인스턴스(레이블이 없는 테스트 데이터)의 레이블을 추론한다. 이 과정에서 쉬운 인스턴스의 레이블이 어려운 인스턴스의 레이블 추론에 활용된다.
실험 결과, 제안 방법은 기존 최신 BERT 기반 모델 대비 모든 벤치마크 데이터셋에서 우수한 성능을 보였다. 특히 SemEval 2014, SemEval 2016, MAMS 데이터셋에서 각각 1.5%, 2%, 1.5% 이상의 F1 점수 향상을 달성했다. 이는 ACD 문제에서 상당한 개선 폭이다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Murtadha Ahm... at arxiv.org 04-09-2024
https://arxiv.org/pdf/2404.05245.pdfDeeper Inquiries