이 논문은 SemEval-2024 Task 1: 의미적 텍스트 관련성 과제에 참여한 IITK 팀의 시스템을 설명한다. 이 과제는 14개 언어(아프리카어와 아시아어 포함)로 구성된 문장 쌍의 의미적 관련성 정도를 자동으로 탐지하는 것이 목표이다.
팀은 두 가지 하위 과제에 참여했는데, Track A는 지도 학습 기반, Track B는 비지도 학습 기반이다. 이 논문은 주로 Track A의 BERT 기반 대조 학습 및 유사도 메트릭 접근법을 다루며, Track B에서는 자동 인코더를 활용한 방법을 소개한다. 또한 부정적 샘플링 전략을 사용하여 바이그램 관련성 말뭉치를 생성하고, 이를 통해 정제된 단어 임베딩을 생성하는 방법도 제안한다.
翻译成其他语言
从原文生成
arxiv.org
更深入的查询