Centrala begrepp
적은 수의 레이블된 인스턴스로 엔티티 쌍 간의 관계를 구분하는 것은 적은 샷 관계 분류에서 중요한 과제이다. 텍스트 데이터의 표현은 도메인, 엔티티, 관계에 걸친 풍부한 정보를 추출한다. 이 논문에서는 다중 문장 표현을 정렬하고 대조 학습을 결합하는 새로운 접근법을 소개한다.
Sammanfattning
이 연구는 적은 샷 관계 분류를 위해 다중 문장 표현을 정렬하는 새로운 방법을 제안한다. 관계 분류에서 일반적으로 엔티티 마커 토큰을 사용하여 문장 표현을 추출하지만, 내부 모델 표현 내에 활용되지 않은 상당한 정보가 있다고 주장한다. 이를 해결하기 위해 [CLS] 토큰, 프롬프팅에 사용되는 [MASK] 토큰, 엔티티 마커 토큰과 같은 다양한 문장 표현을 정렬하는 방법을 제안한다. 이 방법은 대조 학습을 사용하여 이러한 개별 표현에서 보완적이고 판별적인 정보를 추출한다. 이는 관계 설명과 같은 추가 정보를 사용할 수 없는 저자원 환경에서 특히 효과적이다. 또한 관계 설명 정보를 포함하는 시나리오에서도 강력한 성능을 유지하고 다양한 자원 제약에 적응할 수 있는 유연성을 보여준다.
Statistik
적은 수의 레이블된 인스턴스로 엔티티 쌍 간의 관계를 구분하는 것은 적은 샷 관계 분류에서 중요한 과제이다.
텍스트 데이터의 표현은 도메인, 엔티티, 관계에 걸친 풍부한 정보를 추출한다.
내부 모델 표현 내에 활용되지 않은 상당한 정보가 있다.
Citat
"Differentiating relationships between entity pairs with limited labeled instances poses a significant challenge in few-shot relation classification."
"Representations of textual data extract rich information spanning the domain, entities, and relations."
"We argue that substantial information within the internal model representations remains untapped."