מושגי ליבה
본 논문에서는 외부 지식 없이도 혐오 밈 분류 정확도를 향상시키는 프롬프트 기반 네트워크 프레임워크인 Pen을 제안합니다. Pen은 프롬프트 학습을 특징 공간으로 확장하여 추론 인스턴스와 데모 간의 연결을 강화하고, 프롬프트 인식 대조 학습을 통해 샘플 특징 분포를 개선합니다.
תקציר
혐오 밈 분류를 위한 프롬프트 기반 네트워크 Pen: 외부 지식 없이 정확도 향상
본 논문에서는 혐오 밈 분류를 위한 새로운 프롬프트 기반 네트워크 프레임워크인 Pen(Prompt-enhanced Network)을 제안합니다. 최근 연구들은 외부 지식을 활용하여 모델의 분류 성능을 향상시키는 데 중점을 두고 있지만, 관련 없는 정보나 중복된 정보로 인해 모델의 분류 성능이 저하될 수 있다는 문제점이 있습니다. 이에 본 논문에서는 외부 지식 없이도 간단하고 효과적인 네트워크 메커니즘을 통해 중요한 정보를 추출하여 혐오 밈 분류를 위한 PLM(Pre-trained Language Model)의 적응력을 향상시키는 데 중점을 둡니다.
Pen 프레임워크는 크게 세 가지 모듈로 구성됩니다.
1. 지역 정보 전역 추출 (Regional Information Global Extraction)
입력 시퀀스를 추론 인스턴스, 긍정적 데모, 부정적 데모의 세 가지 영역으로 분할합니다.
각 영역의 정보를 LSTM 네트워크를 사용하여 전역 정보로 추출합니다.
2. 프롬프트 기반 멀티뷰 인식 (Prompt-enhanced Multi-view Perception)
추론 인스턴스와 데모의 전역 정보를 특수 토큰 특징 벡터와 결합합니다.
혐오 인식 네트워크와 비혐오 인식 네트워크를 사용하여 추론 인스턴스와 데모 간의 관계를 학습합니다.
혐오 인식 정보, 비혐오 인식 정보, 추론 인스턴스 정보를 융합하여 최종 분류에 사용합니다.
3. 프롬프트 인식 대조 학습 (Prompt-aware Contrastive Learning)
샘플 특징 분포의 품질을 향상시키기 위해 대조 학습을 사용합니다.
동일한 레이블을 가진 마스크 특징 벡터는 가깝게, 다른 레이블을 가진 마스크 특징 벡터는 멀리 위치하도록 학습합니다.
추론 인스턴스의 [mask] 토큰은 동일한 레이블을 가진 데모의 특수 토큰과 가깝게, 다른 레이블을 가진 데모의 특수 토큰과는 멀리 위치하도록 학습합니다.